Utilisation des lexiques utilisateur

(Cette section ne s'applique qu'à l'édition Readiris Corporate)

Au cours du processus de reconnaissance, Readiris se sert de bases de données linguistiques pour effectuer une reconnaissance optimale du texte. Disponibles pour chaque langue prise en charge, ces bases de données linguistiques sont des lexiques standard.

Ces lexiques standard, bien que puissants et très complets, peuvent être complétés par des lexiques utilisateur personnalisés afin d'optimiser la précision de la reconnaissance des caractères. Ces lexiques utilisateur permettent à Readiris de reconnaître des termes techniques, scientifiques, juridiques ou propres à la société qui lui poseraient normalement problème.

Pour créer et utiliser un lexique utilisateur:

Vous pouvez également accéder à l'éditeur User Lexicon Editor au départ du dossier d'installation Readiris.

Vous pouvez également copier-coller des segments de texte d'autres fichiers ou encore importer et modifier des fichiers texte existants.

Conseil : l'importation de documents d'entreprise ou de listes de mots est le moyen le plus rapide de créer un lexique utilisateur des termes spécifiques à la société.

Les mots ou expressions ajoutés sont triés par ordre alphabétique.

Les doublons sont automatiquement supprimés.

Remarque : pour que Readiris puisse reconnaître les mots du lexique utilisateur, vous devez avoir sélectionné la langue correcte. Notez aussi que les mots contenant des caractères qui n'existent pas dans la langue sélectionnée ne seront pas reconnus correctement.

Règles syntaxiques

Plusieurs règles syntaxiques sont appliquées lors de l'insertion de nouveaux termes :

Exemple : IRISCard reste IRISCard.

Exemple : Notre-Dame de Paris reste Notre-Dame de Paris.

Conseil : vérifiez les césures en fin de ligne lorsque vous importez des fichiers texte ou copiez-collez des mots couvrant deux lignes.

Exemple : FAT32 reste FAT32 Systolic 150 devient Systolic