ABBYY FineReader Engine

Comment les images et les documents sont importés et numérisés automatiquement avec ABBYY FineReader Engine

Intégrez des fonctionnalités OCR reposant sur l’IA à vos applications.

Importation d'images et numérisation de document

Offrant une très grande souplesse pour l’import d’images, ABBYY FineReader Engine peut traiter des images issues de nombreuses sources.

Scanner via une interface TWAIN ou WIA est un moyen habituel de convertir directement des documents papier, bien que photographier des documents avec son smartphone ou sa tablette devienne une façon de plus en plus populaire de s’y prendre, en particulier pour les entreprises équipant leurs salariés d’une flotte de mobiles.

Des images déjà sauvegardées, telles que des archives numériques en format TIFF ou JPEG, peuvent aussi être facilement importées. Même des photos prises avec des caméras industrielles, comme celles employées dans le cadre de projets de vision industrielle pour des tests automatisés, peuvent être importées et ensuite traitées. Dans les secteurs d’activité qui nécessitent des normes de sécurité élevées, les fichiers peuvent être chargés directement depuis la mémoire, sans avoir besoin de les sauvegarder d’abord sur le disque.

En plus des documents sous forme d’images comme des scans, photos ou captures d’écran, ABBYY FineReader Engine peut accueillir et traiter des documents en format Office, tels que par exemple Word, Excel ou PowerPoint, ainsi que différents types de PDF.


API de numérisation de documents

Avec ses puissantes options de scan de documents, ABBYY FineReader Engine permet une gestion souple des scans et donne accès à chacun des paramétrages du scan tels que les réglages de la luminosité, de la couleur, la résolution et la taille de l’image, la numérisation recto verso, la pause entre les pages et plus encore.

Fonctionnalités de l’API pour le scan:

  • Accès élargi aux réglages du scan, y compris accès aux capacités des sources de scan
  • Tri des sources du scan par interfaces utilisateurs disponibles ou par types d’API de scan (TWAIN, WIA)
  • Possibilité de préciser le type de compression des images scannées
  • Scan désynchronisé : possibilité de commencer la reconnaissance de pages déjà scannées avant que le scan de toutes les pages ne soit fini.

Import d’images

Le SDK OCR est compatible avec la majorité des formats d’image y compris des multipages TIFF et JPEG 2000 (part1), et fonctionne avec les images en noir et blanc, celles en niveaux de gris et celles en couleur. Il peut ouvrir des fichiers PDF numérisés en utilisant la bibliothèque PDF Adobe®. Il traite différents types de documents PDF, même s’ils ne sont pas conformes aux standards PDF.
Formats de fichiers d'image
BMP, DCX, DjVu, JBIG2, JPEG, JPEG 2000, PNG, PDF, TIFF, PCX, GIF, multi-page TIFF
Formats de fichiers d'image mémoire
  • Raw
  • Bitmap (HBITMAP)
  • DIB
Fonctionnalités supplémentaires pour l'import de PDF
  • Extraction de la couche de texte à partir d'un PDF

  • Entrée de PDF comportant uniquement de l'image et PDF vectorisé

  • Fichiers PDF protégés par mot de passe

  • Possibilité d’extraire des données telles que XML à partir de fichiers PDF/A-3

  • Possibilité de conserver les propriétés du PDF original comme les marque-pages


Prêt à parler à un expert ?