Es posible desactivar lucene temporalmente (cargas masivas)?

cancel
Showing results for 
Search instead for 
Did you mean: 
cesarista
Customer

Es posible desactivar lucene temporalmente (cargas masivas)?

Hola a todos:

Una de las preguntas que me suelo hacer en los procesos de carga masiva de documentos en Alfresco, normalmente con ficheros indexables PDF o DOC, es si puedo desactivar el indexador (Lucene) y programar la indexación (o reactivarla) mas tarde. ¿ Alguien tiene experiencia en estos procesos normalmente dolorosos en CPU/RAM para el servidor y como se puede hacer ? ¿ Se puede hacer a través de index.tracking.cronExpression ?

Un saludo.

–C.
4 Replies
antoniosoler
Member II

Re: Es posible desactivar lucene temporalmente (cargas masivas)?

Hola,
No se si ya te sera de ayuda debido al tiempo que ha pasado desde que hiciste la pregunta.

Se puede hacer que la indexacion no se haga de manera sincrona con la transaccion , sino que se va haciendo a posteriori a su ritmo,
añade estos valores al fichero Global properties:

index.tracking.disableInTransactionIndexing=true
lucene.maxAtomicTransformationTime=0

(ojo, no dejes esto asi cuando tengas usuarios interactivos)

esto seguramente que los ultimos nodos que vayas añadiendo no esten indexados por lo que no apareceran inmediatamente en las busquedas.

En el siguiente reinicio si activas index.recovery.mode=AUTO se pondra al dia si le falta algo para dejarlo todo listo justo despues del arranque.

Otra cosa que podrias mirar para cargas masivas es el modulo que realizo Peter Monks para importaciones masivas:

http://code.google.com/p/alfresco-bulk-filesystem-import/
cesarista
Customer

Re: Es posible desactivar lucene temporalmente (cargas masivas)?

Hola:

Muchas gracias por la respuesta, nunca viene mal. La idea era esa precisamente. Hacer una carga masiva de 2000000 documentos pdf o word con el modulo de peter monks, que puede durar muchas horas y que el sistema no sufra demasiado indexando durante la carga.

Según lo que dices, esos parámetros hacen que la indexación no sea síncrona, pero ¿ cuando empezaría a indexar el sistema ? ¿ solo cuando regenerases los índices ? ¿ o tras un cierto tiempo empezaría a indexar a su ritmo ? 

Un saludo.

–C.
antoniosoler
Member II

Re: Es posible desactivar lucene temporalmente (cargas masivas)?

En teoria continua en background, pero si quieres ver como va o incluso echar un ojo a lo que esta haciendo puedes usar la utilidad que hay en tu propio sistema para ello:

http://localhost:8080/alfresco/service/enterprise/admin/indexcheck

(cambia los valores de host y puerto para tu sistema)

Incluso desde aqui puedes forzar lanzar una reindexacion parcial en background desde la hora a la que empezaste el import.
cesarista
Customer

Re: Es posible desactivar lucene temporalmente (cargas masivas)?

Genial, esto no lo conocía.

Entiendo que la utilidad sólo es para enterprise.

Muchas gracias.

–C.