Rendimiento Alfresco 3.4.2

cancel
Showing results for 
Search instead for 
Did you mean: 
Highlighted
Member II

Rendimiento Alfresco 3.4.2

Buenos dias,

Acabamos de migrar de la versión 3.1.1 a la 3.4.2 y el consumo de CPU no baja del 100%…

Nos hemos dado cuenta de que estos dos threads están consumiendo cada uno un 50%

DefaultScheduler_Worker-5
DefaultScheduler_Worker-7


Alguien podria decirme que son o que hacen estos threads??

Gracias y un saludo!
7 Replies
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

La actualización habrá ido unida a una reindexación.

Es tipico que durante un periodo de tiempo la CPU se ponga al 100% ya que para reindexar el contenido se usan varios componentes (soffice y pdfbox) que consumen bastante CPU.

El tiempo es proporcional al volumen de datos. La solución es simplemente dejarlo terminar.
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

Pues llevamos asi desde el Jueves pasado… a ver cuanto dura… lo curioso es que aunque la cpu esté al 100%, los usuarios trabajan bien…
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

Que volumen de datos teneis? En un top que procesos salen con la cpu a tope ? Usais CIFS ?

Si pones la salida del log quizás podemos ver algo más…
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

El proceso que se está comiendo la cpu es el java.exe, y con el jconsole vemos que los dos hilos que se están comiendo la CPU son los indicados en el primer post…

No tenemos CIFS activado, los ficheros entran por FTP y correo electrónico, y ahora mismo hay medio millón de documentos.
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

En el log se ve algo ? si hay una indexación en marcha se ve facilmente porque de vez en cuando salen mensajes de pdfbox. Monitorizando el tamaño del directorio lucene-indexes también nos podemos hacer una idea.

El indexado de 500k documentos puede llevar bastante tiempo y puede durar varios días, pero lo importante es ver que efectivamente esta indexando y no se trata de otro problema
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

En el log he visto esto… sin hacer nada, de repente salen estas trazas

INFO: Server startup in 220744 ms
[5A, 00, 00, 00, 6D, 00, 61, 00, 69, 00, 6C, 00, 74, 00, 6F, 00, 3A, 00, 42, 00,
41, 00, 53, 00, 4B, 00, 45, 00, 52, 00, 56, 00, 49, 00, 4C, 00, 4C, 00, 45, 00,
53, 00, 4C, 00, 40, 00, 48, 00, 4F, 00, 54, 00, 4D, 00, 41, 00, 49, 00, 4C, 00,
2E, 00, 43, 00, 4F, 00, 4D, 00, 00, 00, 79, 58, 81, F4, 3B, 1D, 7F, 48, AF, 2C,
82, 5D, C4, 85, 27, 63, 00, 00, 00, 00, A5, AB, 00, 00]
[5A, 00, 00, 00, 6D, 00, 61, 00, 69, 00, 6C, 00, 74, 00, 6F, 00, 3A, 00, 42, 00,
41, 00, 53, 00, 4B, 00, 45, 00, 52, 00, 56, 00, 49, 00, 4C, 00, 4C, 00, 45, 00,
53, 00, 4C, 00, 40, 00, 48, 00, 4F, 00, 54, 00, 4D, 00, 41, 00, 49, 00, 4C, 00,
2E, 00, 43, 00, 4F, 00, 4D, 00, 00, 00, 79, 58, 81, F4, 3B, 1D, 7F, 48, AF, 2C,
82, 5D, C4, 85, 27, 63, 00, 00, 00, 00, A5, AB, 00, 00]
09:48:19,821  WARN  [pdfbox.pdfparser.PDFParser] Parsing Error, Skipping Object
java.io.IOException: Error: Expected an integer type, actual='R0000'
        at org.apache.pdfbox.pdfparser.BaseParser.readInt(BaseParser.java:1380)
        at org.apache.pdfbox.pdfparser.PDFParser.parseObject(PDFParser.java:499)

        at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:172)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:878)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:843)
        at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:74)
        at org.alfresco.repo.content.transform.TikaPoweredContentTransformer.tra
nsformInternal(TikaPoweredContentTransformer.java:185)
        at org.alfresco.repo.content.transform.AbstractContentTransformer2.trans
form(AbstractContentTransformer2.java:161)
        at org.alfresco.repo.content.transform.AbstractContentTransformer2.trans
form(AbstractContentTransformer2.java:137)
        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.indexProper
ty(ADMLuceneIndexerImpl.java:949)
        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.createDocum
entsImpl(ADMLuceneIndexerImpl.java:621)
        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.createDocum
ents(ADMLuceneIndexerImpl.java:586)
        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.updateFullT
extSearch(ADMLuceneIndexerImpl.java:1590)
        at org.alfresco.repo.search.impl.lucene.fts.FullTextSearchIndexerImpl.in
dex(FullTextSearchIndexerImpl.java:217)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.
java:39)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAcces
sorImpl.java:25)
        at java.lang.reflect.Method.invoke(Method.java:597)
        at org.springframework.aop.support.AopUtils.invokeJoinpointUsingReflecti
on(AopUtils.java:307)
        at org.springframework.aop.framework.ReflectiveMethodInvocation.invokeJo
inpoint(ReflectiveMethodInvocation.java:183)
        at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(
ReflectiveMethodInvocation.java:150)
        at org.springframework.transaction.interceptor.TransactionInterceptor.in
voke(TransactionInterceptor.java:107)
        at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(
ReflectiveMethodInvocation.java:172)
        at org.springframework.aop.framework.JdkDynamicAopProxy.invoke(JdkDynami
cAopProxy.java:202)
        at $Proxy78.index(Unknown Source)
        at org.alfresco.repo.search.impl.lucene.fts.FTSIndexerJob.execute(FTSInd
exerJob.java:46)
        at org.quartz.core.JobRunShell.run(JobRunShell.java:216)
        at org.quartz.simpl.SimpleThreadPool$WorkerThread.run(SimpleThreadPool.j
ava:549)

y se pone la cpu al 100%
Highlighted
Member II

Re: Rendimiento Alfresco 3.4.2

Eso es que esta reindexando, suelen salir algunos warnings de vez en cuando porque no todos los pdfs se han generado igual y la libreria que los trata alguna vez es incapaz de leer el contenido completo

A veces actualizar el pdfbox puede solucionar problemas

http://issues.alfresco.com/jira/browse/ALF-8097

http://archive.apache.org/dist/pdfbox/