第 6 章:使用培训模式

(此功能对亚洲语言不可用)

如果处理的文档中使用非标准的字体,您会注意到 Readiris 的识别效果存在系统障碍,可使用培训模式来训练识别系统识别这些字体和字符形状。

在学习过程中,凡是识别系统不确定的任何字符都将显示在预览窗口中,同时显示其原单词和 Readiris 建议的结果。

1

Readiris 不确定的字符。

2

发现字符所在的单词。

3

Readiris 建议的识别方案。

学习可大幅提高识别系统的准确度,在识别变形的、有污损的表单时特别有用。通过学习功能,还可在最初无法识别的特殊符号(例如数学、科学符号和图像符号)方面训练 Readiris。

注意:学习发生在识别期间。在识别期间,学习结果将临时存储在计算机内存中。在对文档的其余部分进行 OCR 时,Readiris 将不再显示已学习的字符。当对新的文档进行 OCR 时,学习结果被清除。要永久保存培训结果,请将之存储在培训结果集中。保存培训结果后,即可在无需激活培训模式的情况下使用培训结果。

那么什么时候最好使用培训模式呢?

使用培训模式

如果结果是正确的:

      • 单击学习按钮,将结果作为确定的字符保存。
        在识别期间,学习结果将临时存储在计算机内存中。扫描新文档时,要重新执行相同的步骤。
        为避免执行相同的步骤,可以结合培训模式与培训结果集

      • 单击完成以接受软件提供的所有解析。

如果结果是错误的:

      • 键入正确的字符,然后单击学习按钮。
        注意:如果要处理的文档包含在您的键盘上不存在的特殊字符,单击浏览按钮打开字符控制板。双击要插入的字符。
        您也可以从字符控制板上拖放字符到培训模式中的字符字段。

      • 单击不学习,将结果作为不确定的结果予以保存。
        对于受损的字符使用此命令,如果已学习,这些字符可能导致混淆。例如,数字 1 和字符 I 在许多字体中的字形是一样的。

      • 单击删除以将字符从输出结果中删除。
        使用此按钮以避免文档噪音出现在输出文件中。

      • 单击撤消以更正错误。
        Readiris 保留最后的 32 个操作记录。

      • 单击中止以中止培训模式。
        所有学习结果将被删除。下次处理文档时,将重新开始培训模式。

培训模式完成后,即可保存培训结果集。

结合培训模式与培训结果集

如上所述,您可将培训模式与培训结果集一起使用,以将培训结果永久存储。当您处理具有相同的排版特征的多个文档时,建议使用培训结果集。

:结果集限制为 500 个形状。建议您为具体的应用创建单独的集。

现在,您有几种可能性:

您也可以选择停用培训模式,以及: