Windows OCR integrieren

cancel
Showing results for 
Search instead for 
Did you mean: 
pleibling
Member II

Windows OCR integrieren

Hallo,

ich habe leider mal wieder ein Problem. Ich habe Omnipage 19 Ultimate auf meinem Server installiert. Über eine Netzwerkfreigabe werden die Dateien in einen Scanordner geschoben und anschließend per Hotfolder in durchsuchbare PDF umgewandelt, danach per Cloudconnector per Webdav in den sortieren Ordner verschoben - von dann weitersortiert.

Das funktioniert schon mal so weit.

Jedoch würde ich nun gerne einen Scan Ordner im Alfresco nutzen, so das ich mit der App ein Dokument fotografieren kann, dieses Bild würde dann anschließend per OCR in ein durchsuchbares PDF umgewandelt und in den sortieren Ordner geschoben.

Jedoch stößt hier der Cloudconnector an seine Grenzen.

Ich habe nun gesehen, das auch andere OCR direkt mit integriert haben (z.B. per Batchdatei), jedoch sind die Beiträge teilweise sehr alt - ich würde gerne BEVOR ich wieder rumprobiere (so wie beim letzten Mal mit dem Fileserver Thread) ein paar Fragen beantwortet haben - es wäre schön wenn ich hier wieder ein wenig Hilfe bekommen könnte (mit dem was ich bei Youtube und Google gefunden habe komme ich nicht recht weiter):

a) Wenn ich eine Datei bei Alfreso hochlade, liegt die dann irgendwo auf dem Alfresco Server im Dateisystem (bei den meisten Beispielen war Batchdateien, die die Dateien irgendwo lokal abgegriffen haben) und wenn ja, wo dort?

b) Bei einigen Videos war zu sehen, das man bei einem Tiff Bild auf weitere Aktionen gehen konnte und dort wurde dann OCR angeboten - wie bekommt man das hin?

c) Wie ist der aktuelle Weg, wie man OCR unter Windows (Server 2012 R2 x64) mit einem Alfresco (Community Edition 201701) ans laufen bekommt oder integriert?

Danke vielmals wieder für eure Gelduld und Unterstützung Smiley Happy.

2 Replies
afaust
Master

Re: Windows OCR integrieren

Da nur sehr wenige Deutsche hier aktiv in diesem Sprachbereich unterwegs sind, ist die Wahrscheinlichkeit hoch, dass immer der bzw. die Gleiche(n) antworten.

a) Ja, in einer einfachen Konstellation liegt eine Datei, die nach Alfresco hochgeladen wurde, erstmal "irgendwo" im Dateisystem. Man sollte sich aber idealerweise von diesem Dateisystem gedanklich lösen und annehmen, das Dokument liegt irgendwo ohne direkte Zugriffsmöglichkeit, außer sauber über die Schnittstellen von Alfresco zu gehen.

Es gibt in Alfresco sauber definierte Mechanismen, um ereignisbasiert und ggf. lokalisiert auf bestimmte Ordner automatische Verarbeitungsschritte durchzuführen. Hier sind speziell die Themen Behaviours / Policies bzw. Folder Rules zu nennen. Alternativ sind auch zeitgesteuerte Verarbeitungen über sog. Jobs / Hintergrundprozesse möglich.

b) Eine Aktion in der Oberfläche von Alfresco Share setzt ein Erweiterungsmodul (eigenes oder 3rd-party) voraus, welches zum Einen, eine Aktion / Schnittstelle (i.d.R. Java Code) im Backend mit der entsprechenden Logik bereitstellt, als auch eine Aktion (JS Code) in der Oberfläche zur Kommunikation mit diesen Komponenten im Backend. Die Aktion in der Oberfläche kann u.a. zustandsbasiert abhängig von z.B. Mimetype angezeigt werden, d.h. nur dann, wenn diese auch Sinn macht. Wenn es kein fertiges 3rd-party Modul gibt bzw. ein solches eingesetzt werden soll, dann ist hier Eigenentwicklung gefragt.

c) Der "aktuelle" Weg ist abhängig davon, ob man ein 3rd-party Modul einsetzen möchte und was detaillierte Anforderungen zur Einbindung / Eingrenzung der Verfügbarkeit sind. Aus meiner Sicht ist GitHub - keensoft/alfresco-simple-ocr: Simple OCR action for Alfresco  das mir einzig bekannt, relativ aktuell gehaltene Modul. Leider verlässt Angel Borroy diese Woche das Unternehmen keensoft, so dass ich nicht sagen kann, ob / wie das Modul zukünftig auf neue Alfresco-Versionen angepasst wird. Mit 201701 (5.2) ist es zum akt. Zeitpunkt kompatibel.

Re: Windows OCR integrieren

Alfresco Simple OCR funktioniert auch mit Alfresco 6.0

https://github.com/keensoft/alfresco-simple-ocr/releases 

Und ich werde versuchen, es für die Zukunft zu unterstützen, aber ich kann es nicht versprechen ...

(The text above comes from Google Translator)

Software Engineer in Alfresco Search Team.