Duda feroz :-)

cancel
Showing results for 
Search instead for 
Did you mean: 
normando
Member II

Duda feroz :-)

Hola amigos.

Tengo una duda que no me deja dormir. Alfresco realiza un OCR en los archivos PDF? Porque he subido un y me halla todas las palabras que contiene. El PDF es el producto de un escaneo gráfico. No comprendo cómo es posible. Si alguien quiere ver el PDF lo puedo subir a mi servidor.

Gracias
2 Replies
venzia
Senior Member

Re: Duda feroz :-)

Efectivamente, a través del api iText Alfresco convierte el contenido de los pdfs subidos en texto "plano". La parte fundamental para que este contenido extraido sea válido, es decir contenga las palabras correctas y bien escritas, es que el scanner pase ocr sobre el documento digitalizado (en la mayoría de los casos lo hace por defecto).
Saludos,
normando
Member II

Re: Duda feroz :-)

Gracias Javier por la explicación. Yo supuse lo mismo. Voy a revisar el PDF a ver si efectivamente fue realizado OCR por el scanner.

Saludos