11. Menü OCR
Kapitel hinzufügen

11.1 OCR Attribute
Abschnitt hinzufügen

Die OCR Attribute bestimmen mit welchen Einstellungen die OCR-Engine ein Image bearbeiten soll. Je nach eingesetzter OCR-Engine (ABBYY oder Tesseract) variieren die Einstellungsmöglichkeiten.

Die wichtigsten Einstellungen werden im nachfolgenden Abschnitt erläutert.

11.1.1 Attribute auswählen und einstellen

Globale OCR-Attribute einstellen: Diese Einstellungen werden immer dann von der OCR Engine eingesetzt, wenn keine job- oder seitenspezifischen Einstellungen vorgenommen oder die OCR-Einstellungen durch den Job-Index gesteuert werden.

OCR Attribute für aktuellen Job einstellen: Die gesetzten Werte werden für die OCR-Verarbeitung  des aktuellen Jobs genutzt und sind auch nur für diesen gültig.

OCR Attribute für aktuelle Seite einstellen: Die gesetzten Werte werden für die OCR-Verarbeitung der aktuellen Seite genutzt und sind auch nur für diese gültig.

11.1.2 Attribute zurücksetzen

globale OCR-Attribute zurücksetzten… Die OCR-Attribute werden wieder auf die ursprünglichen Standardwerte der Anwendung zurückgesetzt.

OCR-Attribute des Jobs zurücksetzen… Die OCR-Attribute werden auf die globalen Einstellungen zurückgesetzt

OCR-Attribute des Images zurücksetzen… Die OCR-Attribute werden auf die jobspezifischen oder globalen  Einstellungen zurückgesetzt

11.2 OCR-Attribute einstellen
Abschnitt hinzufügen

Da beide OCR-Engines eine Vielfalt an Einstellungsmöglichkeiten bieten, die leider nicht immer dokumentiert oder nachvollziehbar sind, kann über eine Dropdownliste unterhalb des OCR-Attribute Dialogs anhand einer Erfahrungsstufe (Anfänger, Fortgeschrittener, Experte) die Anzahl der Einstellungen eingegrenzt werden.

Die Attribute für die OCR-Engines sind soweit vorkonfiguriert, dass der Nutzer meist nur noch die Sprache und im Fall von ABBYY die Schrift auswählen muss.

Die wichtigsten Einstellungen bei beiden OCR Engines sind Sprache und Schrift. Werden diese nicht korrekt ausgewählt wird das Ergebnis entsprechend schlecht ausfallen.

11.2.1 Tesseract

11.2.2 ABBYY

11.3 OCR durchführen
Abschnitt hinzufügen

 OCR für markierten Bereich durchführen: Die Texterkennung wird nur für den ausgewählten Bereich auf dem Image durchgeführt.

 OCR für aktuelle Seite durchführen: Die Texterkennung wird für die gesamte Seite durchgeführt

OCR für aktuelle Seite durchführen und Segmente anzeigen…: Die Texterkennung wird für die gesamte Seite durchgeführt. Anschließend werden die von der OCR-Engine erkannten Segmente (Bereiche) angezeigt.

OCR-Text der aktuellen Seite editieren (STRG+O): Der Texteditor wird aufgerufen, hier kann der OCR-Volltext korrigiert oder kopiert werden.

Es wird nur der Fließtext korrigiert, eventuelle Fehler bleiben in den anderen Ausgabeformaten (z.B. PDF, Alto, IWCOCR-eL) bestehen.

11.4 OCR-Zusatzfunktionen
Abschnitt hinzufügen

Die OCR-Zusatzfunktionen stehen erst nach einem erfolgreichen OCR-Lauf zur Verfügung.

OCR-Blöcke hervorheben: Von der OCR erkannt Blöcke werden auf dem Image angezeigt. Sobald der  Mauszeiger auf den markierten Bereich gezogen wird, erschienen in einem Mouseover die OCR Informationen (erkannter Text und Schrifttyp).

OCR-Absätze hervorheben: Von der OCR erkannte Absätze werden auf dem Image angezeigt. Sobald der  Mauszeiger auf den markierten Bereich gezogen wird, erschienen in einem Mouseover die OCR- Informationen (erkannter Text und Schrifttyp)

OCR-Textzeilen hervorheben: Von der OCR erkannt Textzeilen werden angezeigt. Sobald der  Mauszeiger auf den markierten Bereich gezogen wird, erschienen in einem Mouseover die OCR Informationen (erkannter Text und Schrifttyp)

OCR-Worte hervorheben: Von der OCR erkannte Wörter werden angezeigt. Durch ein Mousover über ein Wort werden alle von der OCR-Engine erkannten Merkmale des Wortes angezeigt.

 OCR-Symbole hervorheben: Alle von der OCR erkannten Symbole und Buchstaben werden hervorgehoben.