ABBYY FineReader Engine
Comment les images et les documents sont importés et numérisés automatiquement avec ABBYY FineReader Engine
Importation d'images et numérisation de document
Scanner via une interface TWAIN ou WIA est un moyen habituel de convertir directement des documents papier, bien que photographier des documents avec son smartphone ou sa tablette devienne une façon de plus en plus populaire de s’y prendre, en particulier pour les entreprises équipant leurs salariés d’une flotte de mobiles.
Des images déjà sauvegardées, telles que des archives numériques en format TIFF ou JPEG, peuvent aussi être facilement importées. Même des photos prises avec des caméras industrielles, comme celles employées dans le cadre de projets de vision industrielle pour des tests automatisés, peuvent être importées et ensuite traitées. Dans les secteurs d’activité qui nécessitent des normes de sécurité élevées, les fichiers peuvent être chargés directement depuis la mémoire, sans avoir besoin de les sauvegarder d’abord sur le disque.
En plus des documents sous forme d’images comme des scans, photos ou captures d’écran, ABBYY FineReader Engine peut accueillir et traiter des documents en format Office, tels que par exemple Word, Excel ou PowerPoint, ainsi que différents types de PDF.
API de numérisation de documents
Avec ses puissantes options de scan de documents, ABBYY FineReader Engine permet une gestion souple des scans et donne accès à chacun des paramétrages du scan tels que les réglages de la luminosité, de la couleur, la résolution et la taille de l’image, la numérisation recto verso, la pause entre les pages et plus encore.
Fonctionnalités de l’API pour le scan:
- Accès élargi aux réglages du scan, y compris accès aux capacités des sources de scan
- Tri des sources du scan par interfaces utilisateurs disponibles ou par types d’API de scan (TWAIN, WIA)
- Possibilité de préciser le type de compression des images scannées
- Scan désynchronisé : possibilité de commencer la reconnaissance de pages déjà scannées avant que le scan de toutes les pages ne soit fini.
Import d’images
Formats de fichiers d'image mémoire
- Raw
- Bitmap (HBITMAP)
- DIB
Fonctionnalités supplémentaires pour l'import de PDF
-
Extraction de la couche de texte à partir d'un PDF
-
Entrée de PDF comportant uniquement de l'image et PDF vectorisé
-
Fichiers PDF protégés par mot de passe
-
Possibilité d’extraire des données telles que XML à partir de fichiers PDF/A-3
-
Possibilité de conserver les propriétés du PDF original comme les marque-pages