Secção 5: Selecionar o idioma do documento

O Readiris converte imagens digitalizadas, ficheiros de imagem e ficheiros PDF em documentos de texto editável e documentos PDF pesquisáveis por texto. Para que o Readiris reconheça o texto nas imagens, necessita de selecionar as opções de reconhecimento certas.

De longe, a mais importante opção de reconhecimento é o idioma do documento.

Para selecionar o idioma do documento:

Sugestão Readiris Pro: caso pretenda reconhecer documentos em vários idiomas, certifique-se de que seleciona o idioma com o maior conjunto de caracteres. Por exemplo, se pretender reconhecer um documento com texto em Inglês e Francês, selecione Francês como o idioma do documento. Desta forma, os acentos serão reconhecidos corretamente.

Reconhecer documentos numéricos

Quando processa documentos que apenas contêm números e quase nenhum texto, então, é aconselhável selecionar a opção Numérico:

Quando esta opção é selecionada, o Readiris reconhece apenas os números 0-9 e a série de símbolos seguinte:

+

sinal mais

*

asterisco

/

barra

%

sinal de percentagem

,

vírgula

.

ponto

(

abrir parêntesis

)

fechar parêntesis

-

hífen

=

sinal de igual

$

sinal de dólar

£

sinal de libra

sinal de euro

¥

sinal de iene

 

Reconhecer palavras ocidentais em alfabetos não latinos

Quando processa documentos cirílicos, eslavos, gregos ou asiáticos que também contêm palavras ocidentais escritas no alfabeto latino, tais como nomes próprios, então, é aconselhável selecionar um dos Pares linguísticos disponíveis.

Os pares de idiomas são sempre combinados com o idioma Inglês e estão disponíveis para Russo, Bielorrusso, Ucraniano, Servo, Macedónio, Búlgaro e Grego.

Nota: ao processar documentos asiáticos ou hebraicos, os conjuntos de caracteres mistos são utilizados automaticamente.

Para selecionar um par linguístico:

Selecionar o idioma por página

Quando páginas específicas utilizam um idioma diferente do documento geral, não necessita de definir um idioma secundário. Pode aplicar um idioma diferente a essas páginas.

Selecione as páginas no painel Páginas, clique nas mesmas premindo Ctrl e utilize o comando Idioma para atribuir outro idioma que não o idioma geral do documento a essa(s) página(s).

As páginas com um idioma diferente do idioma geral estão marcadas a vermelho no painel Páginas.

Ao contrário dos idiomas secundários, não existem limites.

Nota: a descrição de cada página no painel Páginas indica qual o idioma que se aplica a essa página.

 

Reconhecer os idiomas secundários num único documento (Apenas Readiris Corporate)

Quando os documentos contêm texto em vários idiomas, é aconselhável selecionar um idioma de reconhecimento principal, combinado com vários Idiomas secundários. Pode selecionar até 4 idiomas secundários:

A lista de idiomas secundários varia, dependendo dos idiomas principais selecionados.

Nota: não selecione idiomas que não se aplicam; quanto maior for o conjunto de caracteres, mas lento será o reconhecimento e maior será o risco de erros de OCR.