Dudas acerca de la indexación de ficheros

cancel
Showing results for 
Search instead for 
Did you mean: 
Highlighted
Active Member

Dudas acerca de la indexación de ficheros

Hola!

Se me plantea una duda acerca de los ficheros en alfresco, a ver si alguien puede solventarla.

Tengo una serie de ficheros subidos al alfresco, entiendo que al subirlos se suben tanto físicamente como en la base de datos para poder realizar búsquedas de contenido dentro del documento, ¿me equivoco? esta es la manera por defecto que tiene alfresco de subir los ficheros, no sé si estoy en lo correcto pero me imagino esto ya que ocupa bastante espacio en la máquina.

Mi pregunta es si hay alguna manera, parámetro etc. que le señalice al alfresco que este fichero que estoy subiendo no quiero que indexe el contenido, si no solo los metadatos/propiedades para que no ocupe tanto, ya que hay ficheros que con las propiedades me basta

Espero haberme explicado bien

Saludos y gracias.

5 Replies
Highlighted
Intermediate

Re: Dudas acerca de la indexación de ficheros

Buenas.

Por partes:

Tengo una serie de ficheros subidos al alfresco, entiendo que al subirlos se suben tanto físicamente como en la base de datos para poder realizar búsquedas de contenido dentro del documento, ¿me equivoco? esta es la manera por defecto que tiene alfresco de subir los ficheros, no sé si estoy en lo correcto pero me imagino esto ya que ocupa bastante espacio en la máquina.

Umagina que tienes un usuario en tu Alfresco  llamado Domingo con el que subes un documento, text.docx. En ese momento tiene asociado unas propiedades tales como nombre, titulo, descripción, etc... A nivel de interfaz eso es lo que ocurre, pero a nivel de servidor tenemos dos partes:

  • Se crea un archivo bin dentro de alfresco/alf_data/contentstore/año/mes/dia/hora/minuto/xxxxxxxxxxxx.bin que no puedes abrir porque es un archivo binario, salvo que sepas la extensión en tu alfresco de ESE binario y lo cambiar (xxxxxxxxxxxx.bin >> xxxxxxxxxxxx.docx) entonces sí que puedes.
  • Todas las propiedades "ligadas" a ese documento, van a parar a tu base de datos.

¿Qué papel juega Solr? Solr no es más que un puntero que sabe dónde está localizado ese binario y sus propipedades. Cada vez que un usuario clicka en un documento, solr actúa y rescata desde tu repositorio y tu base de datos toda la información.

Así es a groso modo como funciona :-) Evidentemente hay un proceso más complejo por detrás, pero con que te quedes con esta idea, podrás ir leyendo más información acerca de esto.

Mi pregunta es si hay alguna manera, parámetro etc. que le señalice al alfresco que este fichero que estoy subiendo no quiero que indexe el contenido, si no solo los metadatos/propiedades para que no ocupe tanto, ya que hay ficheros que con las propiedades me basta

Alfresco te da la capacidad de definir tu propio modelo de datos reutilizando las propiedades que ya exiasten. Cuando realizas tu modelo de datos con tus propiedades personalizadas (por ejemplo VAT tipo numérico, o Carnet de conducir de tipo texto) ahí, a ese nivel,  es dónde tu defines qué quieres que se indexe y qué no.

Por defecto Alfresco indexa todo. Si quieres deshabilitar alguna propiedad te recomendaría que realizaras tu propio modelo de datos con propiedades y juegues con ellas.

Te dejo enlaces que creo que pueden servirte de ayuda para los dos temas (solr y modelo de datos):

Alfresco y SOLR, presentación en español 

Solr overview | Alfresco Documentation 

Repository concepts | Alfresco Documentation 

Content Model | Alfresco Documentation 

Working With Custom Content Types in Alfresco | ECMArchitect | Alfresco Developer Tutorials 

Espero que te haya aclarado un poco ambos temas y al menos tengas información desde la que puedes comenzar a investigar.

Un saludo,

Cristina.

Highlighted
Active Member

Re: Dudas acerca de la indexación de ficheros

Muchas gracias Cristina, muy útil tu respuesta!

Saludos

Highlighted
Intermediate

Re: Dudas acerca de la indexación de ficheros

Espero que te sirva como punto de partida ;-)

¡Un saludo!

Highlighted
Advanced II

Re: Dudas acerca de la indexación de ficheros

Es posible controlar la indexación del contenido por archivo.

Para eso es necesario añadir un aspecto llamado cm:indexControl al archivo, y entonces, configurar la propiedad cm:isContentIndexed como false.

Más informaciones en https://docs.alfresco.com/5.1/concepts/admin-indexes.html

Highlighted
Customer

Re: Dudas acerca de la indexación de ficheros

Además del "aspecto" comentado por Douglas C. R. Paes es posible controlar la indexación desde tu modelo de contenido e incluso desde SOLR.

- How to avoid indexing full content in Alfresco - zylk 

Saludos.

--C.