ABBYY FineReader Engine
Das umfassendste OCR SDK für Softwareentwickler
Textexport und Dokumentenrekonstruktion
Nachdem das Dokument analysiert wurde und die Textbereiche erkannt wurden, werden die Ergebnisse gemäß den vordefinierten Optionen exportiert.
Die OCR-API von ABBYY FineReader Engine bietet eine breite Palette von Optionen für den Export von Erkennungsergebnissen, z. B. in Form von einfachem Text, als XML, verschiedene Arten von PDF- und PDF/A-Dateien, viele Nur-Bild-Formate sowie als editierbare Microsoft® Office-Dokumente. Bei Bedarf gibt sie ein komplett rekonstruiertes Dokument aus – einschließlich aller Formatierungen und nachgestellter Originalstruktur.
Im Exportschritt kann man:
-
Verschiedene Stufen der Layout-Rekonstruktion und Textformatierung festlegen: vom einfachen Text ohne Formatierung bis hin zum Nachbau des kompletten Seitenlayouts - inklusive Spalten, Tabellen, Rahmen, Schriftarten, Schriftgrößen, Absatzformaten, Rändern usw.
-
Zugang zu detaillierter Information über jedes erkannte Zeichen
-
Funktionen zur Bearbeitung und Formatierung des erkannten Textes vor dem eigentlichen Export nutzen
-
Export des erkannten Textes in verschiedene Formate
-
Das Layout von Dokumenten komplett übernehmen – einschließlich der logischen Struktur und Formatierungselementen wie Inhaltsverzeichnis, Kopfzeilen, Fußzeilen, Fußnoten und anderer Elemente
-
Ersetzen von unsicher erkannten Zeichen mit den Bildern dieser Zeichen beim Speichern als PDF
-
Die Farben von Bildern und Text erhalten