Kapitel 5: Auswählen der Dokumentensprache

Readiris konvertiert gescannte Bilder, Bilddateien und PDF-Dateien in bearbeitbare Textdokumente und nach Text durchsuchbare PDF-Dokumente. Damit Readiris Text in Bildern erkennt, müssen Sie die richtigen Erkennungsoptionen auswählen.

Mit Abstand die wichtigste Erkennungsoption ist die Dokumentensprache.

So wählen Sie die Dokumentensprache aus:

Tipp für Readiris Pro: Wenn Sie Dokumente mit mehreren Sprachen erkennen möchten, achten Sie darauf, dass Sie die Sprache mit dem größten Zeichensatz auswählen. Wenn Sie beispielsweise ein Dokument erkennen möchten, dass englischen und französischen Text enthält, wählen Sie Französisch als Dokumentensprache aus. Auf diese Weise werden die Akzente richtig erkannt.

Erkennen von Dokumenten mit Zahlen

Wenn Sie Dokumente verarbeiten, die nur Zahlen und nur sehr wenig oder keinen Text enthalten, wird empfohlen, die Option Numerisch auszuwählen.

Wenn diese Option ausgewählt ist, erkennt Readiris nur die Zahlen 0-9 und die folgenden Symbole:

+

Pluszeichen

*

Sternchen

/

Schrägstrich

%

Prozentzeichen

,

Komma

.

Punkt

(

Klammer auf

)

Klammer zu

-

Bindestrich

=

Gleichheitszeichen

$

Dollarzeichen

£

Pfundzeichen

Eurozeichen

¥

Yenzeichen

 

Westliche Wörter in nicht lateinischen Alphabeten erkennen

Wenn Sie kyrillische, slawische, griechische oder asiatische Dokumente erkennen, die auch „westliche“ Wörter in lateinischer Schrift enthalten (z. B. Eigennamen), wird empfohlen, eines der verfügbaren Sprachkombinationen auszuwählen.

Sprachkombinationen sind immer mit Englisch kombiniert und stehen für Russisch, Weißrussisch, Ukrainisch, Serbisch, Mazedonisch, Bulgarisch und Griechisch zur Verfügung.

Hinweis: Wenn Sie asiatische oder hebräische Dokumente verarbeiten, werden automatisch gemischte Zeichensätze verwendet.

So wählen Sie eine Sprachkombination aus:

Unterschiedliche Sprachen für unterschiedliche Seiten auswählen

Wenn bestimmte Seiten eine andere Sprache verwenden als das übrige Dokument, brauchen Sie keine sekundäre Sprache zu definieren. Sie können eine andere Sprache auf diese Seiten anwenden.

Wählen Sie die Seiten im Bereich „Seiten“ aus, klicken Sie bei gedrückter Strg-Taste darauf und führen Sie den Befehl Sprache aus, um den betreffenden Seiten eine andere Sprache zuzuweisen als dem übrigen Dokument.

Seiten mit einer anderen Sprache als der des übrigen Dokuments werden im Bereich „Seiten“ rot hervorgehoben.

Im Gegensatz zu sekundären Sprachen bestehen hierbei keine Beschränkungen.

Hinweis: Die Quickinfo für jede Seite im Bereich „Seiten“ zeigt an, welche Sprache auf die betreffende Seite angewendet wird.

 

Eine zweite Sprache in einem einzigen Dokument erkennen (nur Readiris Corporate)

Wenn Ihre Dokumente Text in mehreren Sprachen enthalten, wird empfohlen, dass Sie eine Haupterkennungssprache zusammen mit mehreren sekundären Sprachen auswählen. Sie können bis zu 4 sekundäre Sprachen auswählen.

Die Liste der sekundären Sprachen ist je nach ausgewählter Hauptsprache unterschiedlich.

Hinweis: Wählen Sie keine Sprachen aus, die nicht vorkommen; je umfangreicher der Zeichensatz, desto langsamer die Erkennung und desto größer das Risiko, dass OCR-Fehler auftreten.