Hoofdstuk 5: De documenttaal selecteren

Readiris converteert gescande afbeeldingen, afbeeldingsbestanden en PDF-bestanden in bewerkbare tekstdocumenten en doorzoekbare PDF-documenten. Om ervoor te zorgen dat Readiris de tekst in uw beelden kan herkennen, moet u de correcte herkenningsopties selecteren.

Veruit de belangrijkste herkenningsoptie is de documenttaal.

De taal selecteren:

Tip Readiris Pro: ingeval je documenten in meerdere talen wilt herkennen, zorg ervoor dat je de taal met de grootste set karakters selecteert. Als je bijvoorbeeld een document wilt herkennen dat zowel Engelse als Franse tekst bevat, selecteer je Frans als documenttaal. Op die manier zullen de accenten correct worden herkend.

Numerieke documenten herkennen

Wanneer je documenten verwerkt die alleen getallen bevatten en bijna geen tekst is het aanbevolen de optie Numeriek te selecteren.

Wanneer deze optie is geselecteerd, herkent Readiris alleen de cijfers en de volgende serie symbolen:

+

plusteken

*

asterisk

/

schuine streep

%

percentagetaken

,

komma

.

punt

(

open haakje

)

sluit haakje

-

liggend streepje

=

isgelijkteken

$

dollarteken

£

pond-teken

euroteken

¥

yen-teken

 

Westerse woorden in niet-Latijnse alfabetten herkennen

Wanneer u documenten verwerkt in een Cyrillisch, Slavisch, Grieks of Aziatisch schrift die ook 'Westerse' woorden in het Latijnse alfabet bevatten, zoals eigennamen, is het aanbevolen een van de beschikbare taalparen te selecteren.

Taalparen worden altijd gecombineerd met het Engels en zijn beschikbaar voor het Russisch, Wit-Russisch, Oekraïens, Servisch, Macedonisch, Bulgaars en Grieks.

Opmerking: wanneer je Aziatische of Hebreeuwse documenten herkent, worden automatisch gemengde karaktersets gebruikt.

Om een taalpaar te selecteren:

De taal per bladzijde selecteren

Wanneer er slechts op bepaalde bladzijden een andere taal gebruikt wordt dan in de rest van het document, dan is het niet nodig een secundaire taal te selecteren. Het is namelijk mogelijk om alleen op die bladzijden een andere herkenningstaal te gebruiken.

Selecteer de pagina('s) in het paneel Pagina's, gebruik Ctrl-klik en selecteer dan Taal om een andere taal toe te passen op die pagina('s).

Pagina's met een andere taal dan de hoofdtaal zijn in het rood aangeduid in het paneel Pagina's.

In tegenstelling tot bij secundaire talen zijn er hier geen beperkingen.

Opmerking: de tooltip van elke bladzijde in het paneel Pagina's geeft aan welke taal van toepassing is op die bladzijde.

 

Secundaire talen in een enkel document herkennen (alleen Readiris Corporate)

Wanneer uw documenten tekst in meerdere talen bevatten, is het aanbevolen een primaire herkenningstaal in te stellen, in combinatie met verschillende Secundaire talen. U kunt tot 4 secundaire talen selecteren:

De lijst van secundaire talen wijzigt afhankelijk van de geselecteerde primaire talen.

Opmerking: selecteer geen talen die niet van toepassing zijn; hoe groter de karakterset, hoe trager de herkenning en hoe groter het risico op herkenningsfouten.