Seção 5: Selecionar o idioma do documento

O Readiris converte imagens digitalizadas, arquivos de imagem e arquivos PDF em documentos de texto editável e documentos PDF com texto pesquisável. Para o Readiris reconhecer o texto nas imagens, você precisa selecionar as opções de reconhecimento corretas.

O idioma do documento é de longe a opção de reconhecimento mais importante.

Para selecionar o idioma do documento:

Dica (Readiris Pro): caso queira reconhecer documentos em vários idiomas, certifique-se de selecionar o idioma com o maior conjunto de caracteres. Por exemplo, se desejar reconhecer um documento que contém tanto texto em inglês como em francês, selecione Francês como idioma do documento. Dessa maneira, os acentos serão reconhecidos da forma correta.

Reconhecimento de documentos numéricos

Quando estiver processando documentos que contenham apenas números e quase nenhum ou nenhum texto, é recomendável selecionar a opção Numérico:

Quando essa opção for selecionada, o Readiris só reconhecerá os números de 0 a 9 e as seguintes séries de símbolos:

+

sinal de mais

*

asterisco

/

barra

%

sinal de porcentagem

,

vírgula

.

ponto

(

parêntese de abertura

)

parêntese de fechamento

-

hífen

=

sinal de igualdade

$

símbolo de dólar

£

símbolo de libra

símbolo de euro

¥

símbolo de iene

 

Reconhecimento de palavras ocidentais em alfabetos não-latinos

Quando estiver processando documentos cirílicos, eslavos, gregos ou asiáticos que também contenham palavras "ocidentais" escritas no alfabeto latino, como nomes próprios, é recomendável selecionar um dos pares de idiomas disponíveis.

Pares de idiomas são sempre combinados com o idioma inglês e estão disponíveis para russo, bielo-russo, ucraniano, sérvio, macedônio, búlgaro e grego.

Nota: quando documentos asiáticos ou hebraicos são processados, conjuntos de caracteres mistos são usados automaticamente.

Para selecionar um par de idiomas:

Seleção do idioma por página

Quando páginas específicas usarem um idioma diferente do idioma usado no documento geral, você não precisará definir um idioma secundário. Você poderá aplicar um idioma diferente a essas páginas.

Selecione as páginas no painel Páginas, Ctrl-clique nelas e use o comando Idioma para atribuir um idioma diferente do idioma geral do documento a essa(s) página(s).

As páginas com um idioma diferente do idioma geral são marcadas em vermelho no painel Páginas.

Diferentemente dos idiomas secundários, não existem limitações aqui.

Nota: a dica de ferramentas de cada página no painel Páginas indica qual idioma se aplica a essa página.

 

Reconhecimento de idiomas secundários em um único documento (somente Readiris Corporate)

Quando os documentos contêm texto em vários idiomas, é recomendável selecionar um idioma de reconhecimento principal, combinado com vários Idiomas secundários. Você pode selecionar até quatro idiomas secundários:

A lista dos idiomas secundários é alterada em função dos idiomas principais selecionados.

Nota: não selecione idiomas que não se aplicam; quanto maior o conjunto de caracteres, mais lento será o reconhecimento e mais alto será o risco de erros de reconhecimento.