ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

cancel
Showing results for 
Search instead for 
Did you mean: 
jdomingo
Partner

ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

Hola comunidad de Alfresco,

He desplegado la versión 7.4.0.1 en docker-compose y todo funciona correctamente menos al visualizar los documentos doc/docx. Este erro "No se pudo cargar el contenido del PDF" sucede con los doc/docx >4MB. Menor a este tamaño, no hay ningún problema. En el log de alfresco (alfresco.log) se puede visualizar lo siguiente:

2023-07-02 19:47:46,846 ERROR [org.alfresco.repo.web.scripts.RepositoryContainer] [http-nio-8080-exec-16] Server error (06020394)
org.springframework.extensions.webscripts.WebScriptException: 06020008 Wrapped Exception (with status template): 06020393 Failed to execute script 'classpath*:alfresco/templates/webscripts/org/alfresco/repository/thumbnail/thumbnail.get.js': 06020392 Content conversion failed:
reader: ContentAccessor[ contentUrl=store://2023/6/26/19/21/1407a9ef-5d64-47ae-bcd8-3b55d5b9a250.bin, mimetype=application/vnd.openxmlformats-officedocument.wordprocessingml.document, size=5629603, encoding=UTF-8, locale=es_ES]
writer: ContentAccessor[ contentUrl=store://2023/7/2/19/47/5fb7b6c7-a04d-458a-a03e-6ce3adabf4c7.bin, mimetype=application/pdf, size=0, encoding=UTF-8, locale=en_US]
 
He probado a añadir la siguiente config en alfresco-global.properties dado que este error ocurre en otras versiones, pero en esta versión 7.4.0.1 no está funcionando:
 
jodconverter.connectTimeout=10000
jodconverter.maxTasksPerProcess=200
jodconverter.taskExecutionTimeout=120000
jodconverter.taskQueueTimeout=30000

content.transformer.JodConverter.extensions.docx.pdf.maxSourceSizeKBytes=51200
content.transformer.JodConverter.extensions.doc.pdf.maxSourceSizeKBytes=51200
content.transformer.JodConverter.extensions.xlsx.pdf.maxSourceSizeKBytes=51200
content.transformer.JodConverter.extensions.xls.pdf.maxSourceSizeKBytes=51200
 
También he leído que están obsoletas en esta versión, por lo cual, no sé que más hacer.
 
¿Ha alguien le ha sucedido lo mismo?
 
Gracias y un cordial saludo.
 
5 Replies
angelborroy
Alfresco Employee

Re: ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

La versión 7.4 introduce nuevos parámetros para el cliente de Transformación en el Repositorio.

Incluye la configuración para incrementar el timeout por defecto:

https://docs.alfresco.com/content-services/latest/config/mtls/#set-httpclient-properties

Por ejemplo:

httpclient.config.transform.socketTimeout=50000
httpclient.config.transform.connectionRequestTimeout=50000
httpclient.config.transform.connectionTimeout=50000

 

Hyland Developer Evangelist
jdomingo
Partner

Re: ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

Gracias por responder Angel,

Hemos probado esa solución y sí transforma los elementos correctamente de menor tamaño, pero a los documentos de > 15MB los transforma de doc/docx a texto plano. ¿Sabés por qué podría ocurrir? ¿Esto está configurado en algún sitio?

Un saludo,

angelborroy
Alfresco Employee

Re: ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

Parece una configuración específica para vuestra instalación.

¿Qué versión de Transform Service estáis usando?

Por aquí dejé algunos ejemplos de configuración:

https://github.com/aborroy/alfresco-transform-service-3.0.0

Hyland Developer Evangelist
jdomingo
Partner

Re: ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

Estamos utilizando la siguiente imagen de docker, versión 4.0.0:

alfresco/alfresco-transform-core-aio:4.0.0
 
Y la configuración que tenemos es exactamente la misma que hay en github: 
 
 
Un saludo
angelborroy
Alfresco Employee

Re: ERROR al visualizar DOC/DOCX >4MB - No se pudo cargar el contenido del PDF

Puedes verificar la configuración de los transformadores en la URL:

http://localhost:8090/transform/config

Por defecto, el tamaño máximo para convertir Word a PDF (ese es el formato de previsualización en Share) está definido como:

    {
      "transformerName": "libreoffice",
      "coreVersion": "4.0.0",
...
        {
          "sourceMediaType": "application/msword",
          "targetMediaType": "application/pdf",
          "maxSourceSizeBytes": 18874368,
          "priority": 50
        },
    }

Puedes sobreescribir este valor utilizando una configuración similar a la siguiente:

https://github.com/aborroy/alfresco-transform-service-3.0.0/blob/main/docker-compose-extension/defau...

Ten en cuenta que este cambio puede influir en el rendimiento del servicio de transformación y que deberás darle más recursos (RAM especialmente) para que funcione correctamente.

Hyland Developer Evangelist