高度な画像の前処理機能を備え、認識精度を向上
ABBYY FineReader Engineは、画像データを受け取ると画像に様々な前処理を施し、文書の画質をアップして実際の認識工程に向けた準備を行います。そこで使用されるのが、数多くの前処理機能です。 これにより、画質の悪い画像やスマートフォンで撮影された文書も効率よく処理でき、高レベルの認識結果を実現できます。
基本の画像処理機能
FineReader Engineは、以下のような画像処理機能を多数搭載しています。
- 画像の拡大縮小
- 画像のクロップ
- 画像のクリッピング
- プレビューの作成
- 画像の回転(90度、180度、270度)
- 行のゆがみ補正
- 左右反転と色反転
- ノイズの除去
- コントラストの部分的な強調
高度な画像処理機能
- ABBYYカメラOCR技術
- スタンプや手書きメモのある文書の前処理
- 見開きページの自動分割
- ページの向きを自動検出(90度、180度、270度)
- 画像の傾きの自動補正(最大で±20度)
- 画像のスペックル除去(画像の補正)
- ブロック単位の画像のスペックル除去
- テクスチャのフィルタと適応的2値化
- テキストおよび背景のカラー調整
- 様々な境界線や枠線を伴うフィールドからのデータ抽出
高度な写真処理技術(カメラOCR)
デジタルカメラやスマートフォン、タブレットで撮影された文書では解像度や画質は十分であるものの、端末固有の歪曲収差が発生します。 インテリジェント技術により、デジタルカメラで撮影された画像を識別し、特殊な画像処理アルゴリズムを使って焦点ボケや文字列のゆがみ、画像の解像で生じた情報の抜け、暗さが原因で発生した欠陥など、デジタル写真から様々な問題を排除します。
ABBYY FineReader Engineに搭載されたカメラOCR機能
ABBYY FineReader Engineに搭載されたカメラOCR機能
- 画像解像度の補正
- ゆがんだ行の補正
- 台形補正
台形補正
射影歪みは、認識したテキストに次のような問題を引き起こしてしまいます。
- OCRエラーが発生する恐れ、
- ページ分割が正しく実行できない、
- フォントサイズが変わってしまう(ページの上と下で)、などです。
元の画像を補正することにより、OCRで優れた結果を得ることができます。
Blurred images correction
If a camera is not fixed during exposure, an image could be slightly blurred. This is not visible on camera screen, but might cause OCR problems. After transformation of the source image, the binary image becomes better readable.
ISOノイズ補正
このタイプのノイズがある写真は、色の異なる無数の画素で埋められているように見えます。 これは、正しく2値化されない、文字が失われるといった問題を引き起こしてします。 ABBYY FineReader Engineでは特殊フィルタを使用し、背景画像を滑らかにすることでテキストのロスを防ぎます。