ABBYY FineReader Engine
Les technologies de reconnaissance complètes d'ABBYY FineReader Engine
Reconnaissance
Une gamme complète de technologies de reconnaissance
Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.
Reconnaissance optique de caractères (OCR)
La reconnaissance de texte imprimé est disponible en plus de 200 langues :
-
Langues européennes (alphabets latin, cyrillique, arménien, grec)
-
Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
-
FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
-
Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire
Reconnaissance intelligente de caractères (ICR)
La reconnaissance de texte manuscrit est disponible en plus de 120 langues :
- Langues européennes et non européennes
- 22 types régionaux d’écriture manuelle
- Reconnaissance de caractères manuscrits dans des champs et cadres
- ICR pour les chiffres indiens utilisés dans les pays arabes
La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.
Reconnaissance de codes-barres (OBR)
- Codes-barres 1D et 2D
- Extraction rapide de codes-barres. Cette fonction permet la recherche automatique et la reconnaissance de codes-barres quel que soit l’angle du document.
Mode de reconnaissance précis
Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.
Mode de reconnaissance «Rapide»
Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.
Reconnaissance plein-texte et reconnaissance par champ
En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.
Le tableau suivant montre les différences :
Specification | Full text recognition | Field-level recognition |
---|---|---|
Used for: | Document conversion, books archiving | Data capture / Data extraction |
Document analysis: | General document analysis, document analysis for invoices, document analysis for full-text indexing | Manual blocks specification for field-level recognition |
Recognition technologies: | OCR with up to 99% accuracy | OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate |
Verification: | Recommended (for content reuse) | Obligatory (as accuracy is a critical issue in most cases) |
Synthesis: | Used for document reconstruction | Not used |
Export format: | Document files (RTF, DOC, PDF, etc.) | Export to XML file or database |
Reconnaissance plein-texte
La reconnaissance plein texte est le type de reconnaissance de base pour différentes tâches, comme :
- la conversion de livres et de documents pour l’archivage
- la conversion de documents pour la réutilisation de contenu
- l’extraction de texte brut pour la détection de champs et la classification de documents
Toutes ces tâches requièrent la reconnaissance (OCR) de l’intégralité du texte. Le texte qui en résulte est exporté, en fonction de la tâche, sous forme uniquement de texte ou dans un document au format pris en charge.
Reconnaissance par champ
Pour aider à l’exécution de tâches commerciales clés telles que le traitement de formulaires, la classification par mots-clés la vision industrielle ou l’automatisation robotisée, ABBYY FineReader Engine extrait le texte contenu dans des champs ou des zones. Parmi les fonctionnalités-clés, on compte l’OCR et l’ICR multilingues, l’OMR, la reconnaissance des codes-barres et toute une palette de fonctionnalités spécifiques telles que :
- L’extraction de données à partir de champs ayant des cadres et des bords différents
- La définition de contenu de champ en définissant les alphabets, les dictionnaires, les expressions régulières, les styles d’écriture, etc.
- La détection de l’espacement dans les champs
- Le traitement intelligent des blocs avec recoupement des parties et des lignes
- Le nettoyage de blocs de texte permet de définir la taille des « traces » blanches ou noires
- La reconnaissance par champ est aussi prise en charge par des outils spécialement conçus pour les développeurs comme la Voting API et l’outil d'ajustement de la reconnaissance «à la volée».
Langues utilisateur
Pour améliorer la qualité de la reconnaissance, ABBYY FineReader Engine fournit une API pour paramétrer et modifier la reconnaissance des langues, affiner la reconnaissance prédéfinie des langues et ajouter de nouveaux mots aux langues de l’utilisateur. Exemples:
- Pour améliorer la qualité de la reconnaissance ICR sur des formulaires, vous pouvez utiliser les langues de l’utilisateur pour décrire le type d’informations qui peut être entré dans chaque champ (code postal, codes produits, numéros).
- Pour améliorer la reconnaissance des codes produits, numéros de téléphone ou de passeport, vous pouvez créer une nouvelle langue de reconnaissance, ce qui aidera le programme à lire ces données spécifiques.