Funcionamiento de Lucene

cancel
Showing results for 
Search instead for 
Did you mean: 
yakon_8894
Member II

Funcionamiento de Lucene

Buenas,

es mi primer post en este foro, aunque llevo tiempo leyéndolo y siempre me ha sido muy útil. Sin embargo esta vez no consigo encontrar respuesta a una duda.

Tengo un alfresco montado totalmente limpio, sin ninguna extensión ni modificación. Subo un documento pdf llamado CAS-Madrid-ARV.pdf y posteriormente realizo unas pruebas de búsqueda.

Cuando busco la palabra CAS alfresco me devuelve como resultado el pdf antes citado.
Cuando busco la palabra Madrid ocurre lo mismo.
Sin embargo cuando busco la palabra ARV no obtengo ningún resultado.

Realicé pruebas directamente sobre el explorador de nodos usando lucene y obtuve los mismos resultados. La única forma de que lucene me devuelva el pdf en la búsqueda es poniendo *ARV*

Me parece extraño que falle la búsqueda justamente con los últimos caracteres del nombre del documento, y tanto con la búsqueda simple, la avanzada y el explorador de nodos obtengo los mismos resultados. Activando los logs de lucene en el log4j tampoco observo nada raro en las query que alfresco compone, todas son iguales cambiando el texto de búsqueda.

Si alguien pudiera ayudarme explicando a qué se debe este comportamiento o si es un error os lo agradecería.

Un saludo y gracias.
13 Replies
sapodoble_3589
Member II

Re: Funcionamiento de Lucene

Hola, he creado un documento con el nombre que indicas CAS-Madrid-ARV.pdf y me lo encuentra perfectamente sin problemeas buscando por ARV.
Versión: 3.2
pjcaracuel_2349
Active Member II

Re: Funcionamiento de Lucene

Suscribo la prueba anterior, tambien version 3.2 Community

Saludos
venzia
Senior Member

Re: Funcionamiento de Lucene

Puede tener que ver con la tokenizacion que realiza lucene de las propiedades tipo d:text .. esta ademas esta asociada al idioma seleccionado en el login de usuario.
Es un tema algo tosco de entender .. te paso documentación al respecto para que te empapes y comprendas como opera lucene :
http://wiki.alfresco.com/wiki/Search#Config_options_for_indexing
http://lucene.apache.org/java/2_1_0/queryparsersyntax.html
Saludos,
yakon_8894
Member II

Re: Funcionamiento de Lucene

gracias por las respuestas. innovasoft creo que has dado en el clavo con el idioma y la tokenizacion. He realizado algunas pruebas más enfocándolo como me indicas y si subo el documento con el idioma inglés seleccionado, la búsqueda me devuelve el documento busque ARV o CAS, pero si selecciono el español, ya no funciona correctamente. Ahora me tocará revisar la documentación para ver como puedo arreglar este problema.

Un saludo y gracias
venzia
Senior Member

Re: Funcionamiento de Lucene

Aqui te dejo los enlaces que en su dia anote por si tenia problemas al respecto :
http://forums.alfresco.com/en/viewtopic.php?f=3&t=19018&p=62728
http://forums.alfresco.com/en/viewtopic.php?f=16&t=17306
Si cada usuario sube y busca documentos en su idioma concreto no deberias tener problemas .. estos aparecen por ejemplo cuando un usuario sube un documento logueandose en ingles y procede a buscarlo posteriormente entrando con el español.
Saludos,
yakon_8894
Member II

Re: Funcionamiento de Lucene

Lo de subir documentos y buscarlos usando el mismo idioma lo hice, pero con el español es cuando me falla, no he llegado a probar en más idiomas, por que el cliente solo usa el español y algunos el gallego. En inglés no he tenido ningún problema, así que voy a probar lo que se comenta en este post:
http://forums.alfresco.com/en/viewtopic.php?f=3&t=19018&p=62728#p62728

quizás cambiando el diccionario y reindexando me corrija ese comportamiento.
venzia
Senior Member

Re: Funcionamiento de Lucene

Si .. esa es la solucion q parece comentarse en el post.
Suerte y ya nos dices que tal!
yakon_8894
Member II

Re: Funcionamiento de Lucene

Pues no ha funcionado, he modificado el analyser pero el comportamiento sigue siendo el mismo. Al final optaré por abrir un ticket en el soporte y que ellos me den una explicación, ya que al cliente le corre algo de prisa.

Gracias por la ayuda
venzia
Senior Member

Re: Funcionamiento de Lucene

Tras el cambio has reindexado los indices? ..
Segun explica en el post esto soluciona las incoherencias existentes.
Saludos,