ABBYY FlexiCapture SDKとは?
ABBYY FlexiCapture SDKを使用すると、ソフトウェア開発者は文書から意味あるデータを抽出するアプリケーションを簡単に作成することができます。FlexiCapture SDKは、強力なデータキャプチャ機能をソリューションに統合したいシステムインテグレータ、開発エンジニア、サービスプロバイダにとって最適なツールです。ABBYYの機械学習とAI(人工知能)を使用することで、エンド顧客はより多くの業務をより迅速に処理でき、エラーの低減、顧客サービスの改善、コストの削減、より賢明なプロセスの決定が可能となります。
機能と特徴
受賞歴のあるOCR テクノロジー、高度な仕分けおよび、機械学習テクノロジーに基づく組み込み型自動学習を同時に活用することで、FlexiCapture SDK は高いデータ精度を保証します。
アプリケーションとの密接な統合
FlexiCapture SDK は開発者がデータキャプチャをスムーズに作業用のアプリケーションに統合でき、文書処理、抽出したデータ、文書のルーティングを制御、管理できるようにします。
効率的に自動化された文書処理
高い効率性を実現するために、FlexiCapture SDKはデータ検証、高度な文書仕分け、フィードバックによる学習、バックエンド処理やアーカイブ化のためのエクスポートなど、構造化および非構造化フォームや文書を合理的に処理するためのテクノロジーやツールを備えた完全なセットを提供します。
身近な環境でのプログラミング
SDK APIはCOM規格に準拠しているため、 C/C++、Visual Basic、Java、またCOMコンポーネントをサポートするその他の開発ツールで簡単に使用できます。
よくあるご質問
業界最高の性能を誇るOCRと世界で最も幅広い言語ベース
ABBYY FlexiCapture SDKにはABBYY OCR/ICRテクノロジーの最新バージョンが含まれています。日本語、アラビア語、中国語、韓国語を含む209を超える言語にて、最高品質でのOCRが可能です。そのため、ローカライズしたアプリケーションの開発が容易で、世界各国のお客様のニーズに簡単に応じることができます。
高い精度のデータ抽出
ABBYY FlexiCapture SDKは特定のフィールドに対してインテリジェントなデータ抽出機能を提供します。このテクノロジーでは文書中のフィールドを検索し、その周辺領域を分析します。 抽出結果を向上させるために、ソフトウェア 開発者は、構造化または半構造化文書のページに現れるフィールドと繰り返されるデータグループの位置をフィールド抽出トレーニングし、より正確に特定させることができます。エンドユーザが文書での作業を開始すると同時に直ちにトレーニングを始めることも可能です。
フィードバックによる学習
FlexiCapture SDKを使用すると、開発者はフィールド抽出と仕分けのトレーニングを実装できます。これにより、フィールド抽出と仕分けの精度を向上させることができます。
このテクノロジーはエンドユーザからのフィードバックに基づいて学習します。このフィードバックは全ての外部コンポーネントにおいて検証のために収集されます。そして、開発者により実装され、正しいフィールド領域に関する情報(フィールド抽出トレーニングのため)と正しい画像クラス(仕分けトレーニングのため)が含まれます。
画質の改善、補正と管理
この最新版を用いることで、開発者は、モバイル端末によってキャプチャされた画像を含め、手動でも自動でも画質を改善、補正することができるようになりました。これにより、開発者は、ID、保険証券など背景が複雑な文書の処理もできます。例えば、以下のような画像補正を適応させることが可能です。
- 解像度の自動補正
- 画像解像度を特定の解像度で上書き
- 画像の傾き(スキュー)を黒線(セパレータ)、四隅の黒四角、テキストに基づき補正
- 画像をモノクロ画像に変換
- 画像の回転、反転、ミラーリング
- ISOノイズ低減
- カラーマークと不要データの削除
- 画像の自動クロップ
予め用意された画像補正プロファイルを画像に適用することも可能です。
高度な仕分け
高度な文書仕分け機能を使うことにより、API経由で使用可能な事前設定された分類子(クラシファイア)を用いて、受信した文書をカテゴリー別にソートすることができます。仕分けテクノロジーは非常に柔軟性があり、以下の文書を識別することができます。
- 請求書、銀行取引明細書、納税申告用紙、債券などのドキュメントタイプ ごと
- ドキュメントタイプ内のドキュメントの種類ごと。例えばさまざまなベンダーからの請求書等
- 各タイプのドキュメントの1ページ目とそれに続くページ間の、ドキュメントの境界範囲ごと
仕分けテクノロジーには以下の二つのアプローチを使用しています。
- 画像ベースの仕分けは畳み込みニューラルネットワークを活用して、視覚的に異なる文書の違いを識別します。
- テキストベースの仕分けはOCR結果を活用し、統計学と意味解析、テキスト分析に基づき識別します。
この両方のアプローチを活用することで、最も信頼性のある仕分け結果を得ることができます。 FlexiCapture SDKはAPI にゼロから分類子(クラシファイア)をトレーニングし、アプリケーション内のトレーニング済の分類子を文書仕分け処理の高速化のために使用することができます。
自然言語処理
自然言語処理(NLP)を備えたFlexiCapture SDKの最新リリースでは、キャプチャ機能が拡張され、契約、リース、記事などの非構造化文書も対象なりました。NLPテクノロジーを使用すると、手動のデータ入力を必要とするビジネスプロセスをさらに自動化し、重要な文書データをビジネスアプリケーションですばやく利用できるようにします。そして、時間、お金、および労力の節約を可能にします。 データ抽出の品質は、ユーザーフィードバックによるNLPモデルの追加トレーニングを通じて継続的に向上し、検証に費やされるコストと時間を削減します。
バーコード認識
バーコード認識を活用し、文書処理プロセスの効率性を高めます。 ABBYY FlexiCapture SDKは、さまざまなタイプのバーコードを読み取ることができる高性能のバーコード認識テクノロジーを使用しています。また、ニューラルネットワークに基づき、多様な種類の文書からバーコードを抽出できます。これにより、さまざまなアスペクト比で任意の形状の対象を検出できるようになりました。
今すぐ、デモをリクエストしましょう!
ABBYYのインテリジェントオートメーションのデモンストレーションを予約して、貴社の業務効率化やコスト削減、顧客サービスの向上など、さまざまな課題を解決する方法をご覧ください。
読み込み中...