ABBYY FineReader Engine
Das umfassendste OCR SDK für Softwareentwickler
Integrieren Sie KI-basierte OCR-Funktionen in Ihre Applikationen.
Bildvorbearbeitungsfunktionen
Nach dem Erfassen von Bildern führt ABBYY FineReader Engine eine Reihe von Bildbearbeitungsfunktionen aus, um die Qualität der Dokumentbilder für den eigentlichen Erkennungsprozess zu verbessern. Die Technologie nutzt dafür eine Reihe von Vorbearbeitungsfunktionen und erhöht so die Bildqualität. Auf diese Weise können selbst Dokumente von schlechter Qualität oder Dokumente, die mit dem Smartphone abfotografiert wurden, effizient verarbeitet werden und zu guten Erkennungsergebnissen führen.
Grundfunktionen der Bildverarbeitung
FineReader Engine bietet eine Reihe von Funktionen, um die Bilder für die Verarbeitung aufzubereiten:
- Bildskalierung
- Zuschneiden von Bildern
- Bildbeschnitt
- Vorschau erstellen
- Bildrotation (90, 180 und 270 Grad)
- Begradigung von Textzeilen
- Spiegeln und Invertieren
- Rauschentfernung
- Verstärkung des lokalen Kontrasts
Erweiterte Funktionen der Bildverarbeitung
- ABBYY Camera OCR-Technologie
- Vorbearbeitung von Dokumenten mit Stempeln und handschriftlichen Notizen
- Automatische Aufteilung von Doppelseiten
- Automatische Erkennung der Seitenorientierung (90, 180 und 270 Grad)
- Automatisches Geraderücken des Bildes (bis zu +/- 20 Grad)
- Bildbereinigung
- Bildbereinigung in einzelnen Blöcken
- Texturfilterung und adaptive Binarisierung
- Anpassung von Text- und Hintergrundfarbe
- Datenextraktion aus Feldern mit unterschiedlichen Rändern und Rahmen
Einzigartige Fotoverarbeitung (Camera OCR)
Dokumente, die mit Digitalkameras, Smartphones oder Tablets abfotografiert wurden, weisen in der Regel eine ausreichende Auflösung und Bildqualität auf; es kann jedoch zu gerätespezifischen Verzerrungen kommen. Die intelligente Technologie identifiziert Bilder, die von einer Digitalkamera stammen, und führt spezielle Bearbeitungsalgorithmen aus, um Verzerrungen auf Digitalfotos, z. B. verschwommene Konturen, gebogene Textzeilen, fehlende Informationen zur Bildauflösung oder Fehler, die auf schlechte Lichtverhältnisse zurückzuführen sind, zu beseitigen.
ABBYY FineReader Engine bietet folgende Camera OCR-Funktionen:
ABBYY FineReader Engine bietet folgende Camera OCR-Funktionen:
- Korrektur der Bildauflösung
- Begradigung gekrümmter Linien
- Automatische Korrektur von Verzerrungen der 3D-Perspektive
Korrektur von Verzerrungen der 3D-Perspektive
3D-Verzerrungen können während der Erkennung mehrere Probleme verursachen: Erkennungsfehler können auftreten, Doppelseiten werden eventuell nicht richtig aufgeteilt oder die Schriftgröße ist im Ausgabedokument eventuell nicht konsistent und am Anfang der Seite anders als am Ende. Nach der Korrektur des Originalbilds liefert der OCR-Prozess ausgezeichnete Ergebnisse.
Korrektur von unscharfen Bildern
Wird die Digitalkamera während der Aufnahme nicht fixiert, kann ein Bild leicht unscharf werden, wodurch die Erkennungsergebnisse negativ beeinflusst werden können. Um die negativen Einflüsse unscharfer Bilder auf die Erkennungsergebnisse einzuschränken, werden die Bilder automatisch korrigiert und Binärabbilder ‚besser lesbar‘.
Korrektur von ISO-Rauschen
Bei dieser Art von Bildrauschen entsteht der optische Eindruck, dass das Bild mit einer Reihe von Pixeln in unterschiedlichen Farben ausgefüllt ist. Dies kann die Binarisierung negativ beeinflussen und einige Schriftzeichen werden eventuell auf dem Binärabbild gelöscht. Diese Schriftzeichen fehlen dann im Ausgabedokument. Mit Hilfe eines speziellen Filters glättet FineReader Engine den Bildhintergrund und verhindert den Verlust von Text, was wiederum zu genaueren Erkennungsergebnissen führt.