(Cette section ne s'applique qu'à l'édition Readiris Corporate)
Au cours du processus de reconnaissance, Readiris se sert de bases de données linguistiques pour effectuer une reconnaissance optimale du texte. Disponibles pour chaque langue prise en charge, ces bases de données linguistiques sont des lexiques standard.
Ces lexiques standard, bien que puissants et très complets, peuvent être complétés par des lexiques utilisateur personnalisés afin d'optimiser la précision de la reconnaissance des caractères. Ces lexiques utilisateur permettent à Readiris de reconnaître des termes techniques, scientifiques, juridiques ou propres à la société qui lui poseraient normalement problème.
Pour créer et utiliser un lexique utilisateur:
Dans le menu Configuration, cliquez sur Options d'analyse de page.
Cliquez sur Editeur de lexique.
Vous pouvez également accéder à l'éditeur User Lexicon Editor au départ du dossier d'installation Readiris.
Dans le menu Fichier, cliquez sur Nouveau pour ouvrir un nouveau lexique.
![]()
Indiquez les mots que Readiris doit reconnaître et cliquez sur le bouton Ajouter.
Vous pouvez également copier-coller des segments de texte d'autres fichiers ou encore importer et modifier des fichiers texte existants.
Conseil : l'importation de documents d'entreprise ou de listes de mots est le moyen le plus rapide de créer un lexique utilisateur des termes spécifiques à la société.
Les mots ou expressions ajoutés sont triés par ordre alphabétique.
Les doublons sont automatiquement supprimés.
Cliquez sur Enregistrer pour enregistrer le fichier de lexique dans le dossier de votre choix.
Revenez dans les options d'analyse de page dans Readiris.
Cliquez sur Lexique > Sélectionner un lexique.
Sélectionnez le fichier de lexique utilisateur de votre choix dans la boîte de dialogue.
Remarque : pour que Readiris puisse reconnaître les mots du lexique utilisateur, vous devez avoir sélectionné la langue correcte. Notez aussi que les mots contenant des caractères qui n'existent pas dans la langue sélectionnée ne seront pas reconnus correctement.
Cliquez sur OK pour enregistrer les paramètres.
Ensuite, traitez vos documents pour lancer la reconnaissance.
Plusieurs règles syntaxiques sont appliquées lors de l'insertion de nouveaux termes :
La casse est préservée.
Exemple : IRISCard reste IRISCard.
Tous les signes de ponctuation et les caractères spéciaux au début et à la fin des mots sont automatiquement éliminés.
Les tirets des mots composés sont conservés.
Exemple : Notre-Dame de Paris reste Notre-Dame de Paris.
Conseil : vérifiez les césures en fin de ligne lorsque vous importez des fichiers texte ou copiez-collez des mots couvrant deux lignes.
Les nombres ne sont pas acceptés. En revanche, les chiffres présents au sein des noms de produits sont conservés.
Exemple : FAT32 reste FAT32 Systolic 150 devient Systolic