Verarbeitung von PDF-Dateien, Stichwort: OCR

cancel
Showing results for 
Search instead for 
Did you mean: 
quick-time
Member II

Verarbeitung von PDF-Dateien, Stichwort: OCR

Hallo liebe Forumsmitglieder,

bin auf der Suche nach Informationen zu Alfresco hier im Forum gelandet und möchte mich schon jetzt für die vielen guten Info's und Ratschläge bei allen beantworten. Vieles hat mir bereits weitergeholfen.

Ich bräuchte jetzt eine Aussage darüber, ob ich mit meinen Vorstellungen richtig liege oder ob für meinen Anwendungsfall Alfresco nicht geeignet ist.

Alfreso soll in einer kleinen Firma eingesetzt werden. Hier fällt ein riesiger Berg an technischen Zeichnungen an. Zur Zeit wird mittels einem DIN A3 MFC jede Zeichnung in ein festgelegtes Verzeichnis auf dem internen Server (Windows) als PDF-Datei gescannt. Abends setzt sich ein Mitarbeiter hin und verschlagwortet die Datei dann im Dateinamen. Sprich > Zeichnung_Nr_Datum.pdf <. Da es aber immer mehr wird mit den Zeichnungen, soll ein DMS zum Einsatz kommen und hier habe ich an Alfresco gedacht.

Meine ausschlaggebende Frage ist nun:
Kann Alfresco die PDF-Dateien aus dem Scan-Verzeichnis automatisch Verschlagworten und kann man dabei einen Bereich auf der Zeichnung (Zeichnungsfeld) exklusiv bezeichnen (Z.B Alfresco soll nur einen Bereich unten rechts auf der Zeichnung in der größe 10 x 15 CM indizieren)?

Falls die Antwort hier positiv ist, was braucht es dazu oder reicht dafür Alfreso in der CE?

Viele Grüße und danke im voraus

Michael
1 Reply
critter
Member II

Re: Verarbeitung von PDF-Dateien, Stichwort: OCR

Tach Michael,

Alfresco kann das nicht. Es muss irgendein OCR Engine dazwischen. Wir haben bereits gute erfharung mit Kofax gemacht. Es gibt ein Übergabe Script, womit die Daten direkt nach Alfresco übergeben werden können und die entsprechende Metadaten (soweit das Content Model vorbereitet ist) geschrieben. Mit den so extrahierten Metadaten lässt sich danach so zimelich alles einstellen. Manko ist hier: Kofax ist nicht umsonst. je nach Dokumentaufkommen kann's entsprechend teuerer oder biliger sein.
Ich meine allerdings zu wissen, dass Kofax Express Lizenztechnisch ziemlich unten anfängt,hat aber eine Restriktion bezüglich der übergebenen Metadaten Anzahl. Je nach dem wie viel Metadaten Ihr von den Zeichnungen extrahieren möchtet, kann esfür euch geeignet oder ungeeignet sein. In Kofax kannst du dann an einem beliebigen Bereich die OCR Erkennung einsetzen.

mfg

p.