Раздел 5: Выбор языка документа

Readiris преобразует отсканированные изображения, файлы изображений и PDF-файлы в редактируемые текстовые документы и PDF-документы с возможностью поиска. Чтобы приложение Readiris могло распознать текст в изображениях, необходимо выбрать правильные параметры распознавания.

Язык распознавания является наиболее важным параметром распознавания.

Чтобы выбрать язык документа:

Совет для Readiris Pro. При распознавании документов на нескольких языках обязательно выберите язык с наибольшим набором символов. Например, при распознавании документа, содержащего английский и французский текст, выберите французский в качестве языка документа. Таким образом, акценты будут распознаны должным образом.

Распознавание числовых документов

При распознавании документов, содержащих только числа и не содержащих или почти не содержащих текст, рекомендуется выбрать параметр Цифровой.

В этом случае Readiris будет распознавать только цифры 0-9 и следующие последовательности символов:

+

знак "плюс"

*

звездочка

/

косая черта

%

знак процентов

,

запятая

.

точка

(

открывающая скобка

)

закрывающая скобка

-

дефис

=

знак "равно"

$

знак доллара

£

знак фунта

знак евро

¥

знак йены

 

Распознавание западных слов в нелатинских алфавитах

При обработке кириллических, славянских, греческих или азиатских документов, содержащих «западные» слова на латинице, например имена собственные, рекомендуется выбрать одну из доступных языковых пар.

Языковые пары всегда включает английский язык и доступны для русского, белорусского, украинского, сербского, македонского, болгарского и греческого языков.

Примечание. При обработке документов на азиатских языках и иврите смешанные наборы символов применяются автоматически.

Для выбора языковой пары:

Выбор языка для каждой страницы

Если на некоторых страницах документа используется язык, который отличается от основного языка, указывать дополнительный язык не требуется. При необходимости к отдельным страницам можно применить другой язык.

Для этого выберите нужные страницы на панели страниц, затем, удерживая клавишу Ctrl, щелкните их мышью, вызовите команду Язык, и выберите язык, отличающий от основного языка документа.

Страницы, язык которых отличается от основного языка, будут отмечены красным цветом на панели страниц.

Ограничения дополнительных языков не применяются в данном случае.

Примечание. Назначенный каждой странице язык указывается на всплывающей подсказке этой страницы на панели страниц.

 

Распознавание дополнительных языков в одном документе (только Readiris Corporate)

Если документы содержат текст на нескольких языках, рекомендуется выбрать главный язык распознавания и несколько дополнительных языков. Можно выбрать до 4 дополнительных языков.

Список дополнительных языков меняется в зависимости от выбранных основных языков.

Примечание. Не следует выбирать языки, которые отсутствуют в документе. Увеличение набора символов приведет к замедлению распознавания и увеличению риска ошибок OCR.