Section 5 : Sélection de la langue du document

Readiris convertit des images numérisées, des fichiers image et des fichiers PDF en documents texte modifiables et en documents PDF indexés. Pour que Readiris puisse reconnaître le texte dans vos images, vous devez sélectionner les options de reconnaissance appropriées.

L'option de reconnaissance de loin la plus importante est la langue du document.

Pour sélectionner la langue du document :

Conseil pour Readiris Pro : si vous souhaitez reconnaître des documents en plusieurs langues, veillez à sélectionner la langue possédant le jeu de caractères le plus étendu. Si, par exemple, vous souhaitez reconnaître un document bilingue français-anglais, sélectionnez le français comme langue du document. De cette façon, les accents seront reconnus correctement.

Reconnaissance des documents numériques

Lorsque vous traitez des documents qui contiennent essentiellement des nombres et peu ou pas de texte, il est recommandé de sélectionner l'option Numérique :

Lorsque cette option est sélectionnée, Readiris reconnaît uniquement les chiffres entre 0 et 9 ainsi que les symboles suivants :

+

signe plus

*

astérisque

/

barre oblique

%

pourcentage

,

virgule

.

point

(

parenthèse ouvrante

)

parenthèse fermante

-

tiret

=

signe égal

$

dollar

£

livre sterling

euro

¥

yen

 

Reconnaissance des mots occidentaux dans des alphabets autres que le latin

Lorsque vous traitez des documents cyrilliques, slaves, grecs ou asiatiques qui contiennent également des mots occidentaux écrits en alphabet latin, par exemple des noms propres, il est recommandé de sélectionner l'une des combinaisons linguistiques disponibles.

Les combinaisons linguistiques contiennent toujours l'anglais et l'une des langues suivantes : russe, biélorusse, ukrainien, serbe, macédonien, bulgare et grec.

Remarque : lors du traitement de documents en langue asiatique ou en hébreu, les jeux de caractères mixtes sont automatiquement utilisés.

Pour sélectionner une combinaison linguistique :

Sélection de la langue par page

Si certaines pages sont rédigées dans une langue différente du reste du document, il n'est pas nécessaire de définir une langue secondaire. Il est possible d'appliquer une langue différente à ces pages.

Sélectionnez la ou les pages en question dans le volet Pages, en cliquant dessus tout en appuyant sur la touche Commande, puis utilisez la commande Langue pour leur affecter une autre langue que la langue du document.

Les pages dont la langue est différente de celle du document sont marquées en rouge dans le volet Pages.

Contrairement aux langues secondaires, aucune limitation ne s'applique dans ce cas.

Remarque : dans le volet Pages, une infobulle accompagne chaque page pour indiquer la langue qui lui est appliquée.

 

Reconnaissance des langues secondaires dans un même document (Readiris Corporate uniquement)

Lorsque vos documents contiennent du texte en plusieurs langues, il est recommandé de sélectionner une langue principale et plusieurs langues secondaires. Vous pouvez sélectionner jusqu'à 4 langues secondaires.

La liste des langues secondaires varie selon les langues principales sélectionnées.

Remarque : ne sélectionnez pas de langues inutiles. En effet, plus le jeu de caractères est volumineux, plus la reconnaissance est lente et le risque d'erreurs d'OCR élevé.