Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Beispiel für die Verwendung einer OCR-Engine zur Verarbeitung von Textausschitten.

 

Benötigt werden :

jadice-documentplatform ab Version 5.

Tesserarct-ocr Version 3 http://code.google.com/p/tesseract-ocr/

 

Jadice-Viewer bietet die Möglichkeit mittels des TextSelectionTools einen Bereich eines Textes aus zu wählen. Dieser Bereich kann beispielsweise als Bild gerendert und in der Zwischenablage gespeichert werden. Mit ein paar Anpassungen lässt sich das so erzeugte Bild an eine OCR-Engine weiterleiten die dann den enthaltenen Text extrahieren kann. Um diese Funktionalität mit der jadice documentplatform zu nutzten genügt es ein eigenes Command zu erstellen, dass die obengenannten Schritte durchfürht. Das folgende Beispiel zeigt eine solche Implementierung des AbstractSelectionCommands:

...