帳票処理ソリューション – AI OCR導入時の重要ポイント
9月9日, 2020
「近年RPAやDX(デジタルトランスフォーメーション)といったキーワードが話題となり、様々な企業が取り組みを行っています。中でも重要な役割を担う技術がOCR(光学文字認識, Optical Character Recognition)ですが、本コラムではAI OCRソリューションを選択する際に重要なポイントについて記述します。
またその中で、ABBYY製品が活躍している領域、およびその特徴をご紹介します。
OCRとは
OCRとはOptical Character Recognitionの略で、光学文字認識とも呼ばれます。文字を含む画像を利用可能なデジタルデータである文字情報に変換する技術です。ビジネスで利用されるOCRソリューションとしては、大きく分けて以下の2種類があります。
全文OCR
画像に表示されている情報(文字、表、画像、等)を全て認識し、デジタル化する。Officeドキュメント(ワード、エクセル、等)へのドキュメント変換に利用されることが多い。ABBYY製品としては、ABBYY FineReader PDF(個人向け)や ABBYY FineReader Server(企業向け)などがある。
帳票OCR
画像から必要な文字情報を取得・認識し、デジタル化する。RPA等で利用されるソリューションとしてはこちらが多い。代表的な利用例としては請求書処理があり、スキャンした紙の請求書から必要な情報(会社情報、日付、金額、等)を取得し、RPAや社内システムの入力とする。ABBYY製品としては、ABBYY FlexiCapture がある。
ここからは特に、RPA, DXで利用されている帳票OCRについて、ソリューション選択時の評価ポイントについて触れたいと思います。
帳票処理ソリューションの評価ポイント
帳票処理ソリューションを選択する際、評価ポイントとして何に注目されてますでしょうか?多くの方がOCRの認識精度をまず第一に挙げられるのではないでしょうか。実は、これはとても危険です。弊社でも、これまで認識精度に着目してOCR帳票処理ソリューションを選定した結果、思うように導入効果が出ず何とかしてほしい、といった相談を頂戴することが多数ありました。なぜこのようなことが起こるのでしょうか。以下では、主な原因について説明いたします。
認識精度の定義について
認識精度というと文字毎のOCR認識率を思い浮かべる方が多いかと思いますが、帳票OCRにおいては異なります。
帳票OCRでは以下のような利用プロセスが一般的ですが、目検(確認・修正)時の作業効率に大きな影響を与えるのは、実は文字毎の認識率ではなく、「仕分け~項目抽出~項目内の文字認識」といったトータルでの抽出精度となります。例えば、仕分け時に誤分類が発生すると、後続の処理全てにおいて、やり直しまたは修正が必要となってしまうことになります。
ROI(費用対効果)について
上記プロセスを想定するとご理解いただけるかと思いますが、実は文字毎のOCR認識精度が数%違っても全体のROIへの影響はほとんどありません。それよりも、仕分け・項目抽出等トータルでの精度、確認・修正のしやすさ、他システム連携のしやすさ、処理スピード性能等、プロセス全体で効率化が図られるかを評価する必要があります。
以上より、帳票処理ソリューションを選択する際の基準としては、以下のようなポイントが挙げられます。これらの中からProjectの要件に応じて取捨選択をし、評価・ジャッジをすることが重要です。
【帳票処理ソリューション選択時の評価ポイント】
- 「仕分け~項目抽出~項目内の文字認識」トータルでの認識精度
- 「インポート~目検~出力」機能・UI
- 処理性能(高トランザクションの場合)
- 他システム連携性(必要な場合)
- 開発・メンテナンスコスト
ABBYY FlexiCaptureの強み
帳票処理ソリューション選択時の評価ポイントをふまえ、FlexiCaptureの評価が特に高いポイントについてご紹介いたします。
多種多様な帳票について、柔軟な設定(帳票定義)により高精度の読み取りを実現
ビジネスの現場ではレイアウトが単純ではない帳票が多数見受けられますが、このようなケースでは簡単な設定や学習だけでは期待通りの情報を取得できないことがあります。そのような場合でもFlexiCaptureであれば柔軟かつ高度な設定(帳票定義)により正しく情報を取得することが可能です。
例2: 帳票のレイアウトが異なる複数ページにわたる明細の読み取り
簡単かつ高精度な仕分け機能
先程お話しした通り、自動仕分けの精度はプロセス全体に大きな影響を与えます。
ABBYY FlexiCaptureには簡単な操作で高精度な仕分けを実現する機能があり、世界中で利用されています。数百~数千の帳票仕分けの実績が多数ございます。
柔軟にカスタマイズ可能な検証ツールやワークフロー
帳票処理ソリューション単体で実際の業務フローにあったワークフローを実現できるかどうかは、開発・メンテナンスコストに大きく影響します。
ABBYY FlexiCaptureは、複数オペレータによる共同作業、複数の検証(目検)ステップ、条件に応じた特定イベント作成等、柔軟にワークフローをカスタマイズ可能な他、検証そのものについても、UIのカスタマイズ性が高く、また様々なカスタムルール(自動補正、フォーマットチェック、等)も設定可能であるなど、多種多様な要件を満たすことができる唯一無二のソリューションとなります。
他システム・アプリケーションとの連携機能
FlexiCaptureの大きな特徴として、様々なシステム・アプリケーションとの連携機能が挙げられます。例えばSAP, Salesforce, SharePointなどの他、Blue Prism, UiPath, WinActor,などのRPA製品とも接続可能です。
その中でも特殊な例としては、以下の記事のようにOCRエンジン自体も外部エンジンと連携する事例もあります。
※FlexiCaptureは日本語手書き認識をサポートしていないため、外部手書きエンジンと連携する事例となります。
まとめ
本コラムでは、帳票処理ソリューション選択、導入時の評価ポイントについて紹介しました。これらのポイントを踏まえ、適切なソリューションを選定することが非常に重要となります。また評価にあたり、ABBYY FlexiCapture が選択肢となるような場合は、是非弊社までご連絡頂ければ幸いです。