Problema en saber que archivos no estan indexados y como reindexarlos

cancel
Showing results for 
Search instead for 
Did you mean: 
MrNico
Customer

Problema en saber que archivos no estan indexados y como reindexarlos

Hola, un poco de historia, tenemos un alfresco 4.1 en el cual se subieron documentos en forma masiva (80GB de documentos) despues de muchas pruebas, finalmente se desecho esa opcion, pero nadie elimino esos archivos.

Me gustaria saber que archivos son (tengo una fecha exacta en la que se realizo esto) y poder eliminarlos.

Al borrar los indices de solr veo que aparecen muchos miles de errores de este tipo , donde reclama que no esta definido el "tipo"

¿Es posible saber que archivos son esos? y eliminarlos? estoy seguro que son archivos basura.

¿Puedo crear ese "tipo" para que solr pueda reindexarlos  nuevamente? 

¿Si solr no indexa un archivo, puedo buscarlo de alguna forma y eliminarlo?

 

2021-10-21 01:48:24,721 WARN [repo.dictionary.DictionaryDAO] [http-bio-8443-exec-15] Type not found: {http://www.xxxxxxxx.com/content/1.0}log
2021-10-21 01:48:24,722 ERROR [extensions.webscripts.AbstractRuntime] [http-bio-8443-exec-15] Exception from executeScript - redirecting to status template error: 092134790 Wrapped Exception (with status template): 092135664 Nodes with no type are ignored by SOLR
org.springframework.extensions.webscripts.WebScriptException: 092134790 Wrapped Exception (with status template): 092135664 Nodes with no type are ignored by SOLR
at org.springframework.extensions.webscripts.AbstractWebScript.createStatusException(AbstractWebScript.java:1067)
at org.springframework.extensions.webscripts.DeclarativeWebScript.execute(DeclarativeWebScript.java:171)
at org.alfresco.repo.web.scripts.RepositoryContainer$3.execute(RepositoryContainer.java:422)
at org.alfresco.repo.transaction.RetryingTransactionHelper.doInTransaction(RetryingTransactionHelper.java:452)
at org.alfresco.repo.web.scripts.RepositoryContainer.transactionedExecute(RepositoryContainer.java:491)
at org.alfresco.repo.web.scripts.RepositoryContainer.transactionedExecuteAs(RepositoryContainer.java:529)
at org.alfresco.repo.web.scripts.RepositoryContainer.executeScript(RepositoryContainer.java:268)
at org.springframework.extensions.webscripts.AbstractRuntime.executeScript(AbstractRuntime.java:378)
at org.springframework.extensions.webscripts.AbstractRuntime.executeScript(AbstractRuntime.java:209)
at org.springframework.extensions.webscripts.servlet.WebScriptServlet.service(WebScriptServlet.java:132)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:727)
at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:303)
at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208)
at org.apache.tomcat.websocket.server.WsFilter.doFilter(WsFilter.java:52)
at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:241)
at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208)
at org.alfresco.web.app.servlet.GlobalLocalizationFilter.doFilter(GlobalLocalizationFilter.java:61)
at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:241)
at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208)
at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:220)
at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:122)
at org.apache.catalina.authenticator.AuthenticatorBase.invoke(AuthenticatorBase.java:610)
at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:170)
at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:98)
at org.apache.catalina.valves.AccessLogValve.invoke(AccessLogValve.java:950)
at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:116)
at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:408)
at org.apache.coyote.http11.AbstractHttp11Processor.process(AbstractHttp11Processor.java:1040)
at org.apache.coyote.AbstractProtocol$AbstractConnectionHandler.process(AbstractProtocol.java:607)
at org.apache.tomcat.util.net.JIoEndpoint$SocketProcessor.run(JIoEndpoint.java:315)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:724)
Caused by: org.alfresco.error.AlfrescoRuntimeException: 092135664 Nodes with no type are ignored by SOLR
at org.alfresco.repo.solr.SOLRTrackingComponentImpl.getNodesMetadata(SOLRTrackingComponentImpl.java:697)
at sun.reflect.GeneratedMethodAccessor531.invoke(Unknown Source)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.alfresco.repo.management.subsystems.SubsystemProxyFactory$1.invoke(SubsystemProxyFactory.java:72)
at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:172)
at org.springframework.aop.framework.JdkDynamicAopProxy.invoke(JdkDynamicAopProxy.java:202)
at com.sun.proxy.$Proxy175.getNodesMetadata(Unknown Source)
at org.alfresco.repo.web.scripts.solr.NodesMetaDataGet.executeImpl(NodesMetaDataGet.java:181)
at org.springframework.extensions.webscripts.DeclarativeWebScript.executeImpl(DeclarativeWebScript.java:235)
at org.springframework.extensions.webscripts.DeclarativeWebScript.execute(DeclarativeWebScript.java:64)
... 31 more

1 Reply
cristinamr
Advanced

Re: Problema en saber que archivos no estan indexados y como reindexarlos

Buenas.

Te comento qué haría yo:

- Reindexar solr para que "todo vuelva a la normalidad" (que aparezcan en los resultado, etc...).

- Crear un java webscript, en el controlador haría una búsqueda por fecha para crear un informe.

- Revisar ese informe.

- Si es todo correcto, implementaría el metodo para eliminarlos.

Para que tengas varias referencias por si no sabes por dónde tirar:

- Tutorial para webscripts

- Más tutoriales

¡Un saludo!

--
VenziaIT: helping companies since 2005! Our ECM products: AQuA & Seidoc