ABBYY AI(人工知能)
Purpose-Built AI Center(目的に特化したAIセンター)
ABBYYの最先端AIツールが集結する中心的な場所です。ビジネスプロセスの自動化を促進するための正確なデータを提供します
ABBYYソリューションの中核には、最高水準のインテリジェント文書処理(IDP)を実現するための技術が組み合わされています。
ABBYYのIDPプラットフォームには、画像補正からオブジェクト検出、OCR/ICR、分類、半構造化文書や非構造化文書からのデータ抽出まで、すべてのプロセスに革新的なAIが組み込まれています。
最適な技術と手法を組み合わせることで、ABBYY IDPソリューションは、あらゆる形式、言語、構造のドキュメントを処理できます。当社の専門技術はすべて、最小限のリソースで最適な推論結果を得られるように最適化されており、コスト効率を高め、お客様に最大のROIを提供します。
ABBYYの目的に特化したソリューションを支える先端AIツール
タスクに特化し、高度に最適化されたAIモデルとアルゴリズムの組み合わせ
Phoenix 1.0
最先端のマルチモーダルモデル「Phoenix 1.0」 は、視覚データ処理のための畳み込みニューラルネットワーク(CNN) とテキスト理解のためのRoBERTa言語モデルを統合することで、高度な画像およびテキスト分析を組み合わせています。Phoenixは、ゼロショットでのキー/値ペア抽出機能を提供する革新的なAI駆動型パイプラインを搭載しており、文書モデルの学習における最も面倒な作業を自動化します。幅広い言語理解タスクに対応する広範な汎用言語モデルとは異なり、Phoenixは、特にマルチモーダルデータを取り扱う場合、文書処理のためのより強固なフレームワークを構築します。それにより、大規模言語モデルだけでは完全には達成できない、特徴抽出の強化、ワークフロー処理の効率化、より深い文脈の理解を実現します。この専門性は、文書を通じて伝達される情報に大きく依存するユースケースに最適な選択肢であり、データが正確かつ迅速に処理されることを保証します。
Phoenixは、文書処理タスクの効率性と有効性を向上させることを目的として開発されました。画像分析における畳み込みニューラルネットワークの長所と、RoBERTaの高度な言語理解力を組み合わせることで、テキストと視覚的(ビジュアル)要素の両方を含む複雑な文書をより深く理解することが可能になります。焦点を絞ったこのアプローチにより、汎用モデルを使用する場合と比較して、情報の抽出と分析においてより優れた精度を達成することができます。さらに、この設計を通じて処理ワークフローを合理化することで、リソース消費を最小限に抑え、スピードの向上と運用コストの削減を図ることができます。その結果、組織は文書をより効率的に処理できるようになり、文書処理において大きな価値を生み出し、全体的な生産性を向上させることができます。
機械学習
当社のインテリジェント文書処理は、さまざまな技術を組み合わせることで、比類のないパフォーマンスを実現しています。深層機械学習と高速機械学習を組み合わせることで、ストレート・スルー・プロセッシング(STP)率を最大化します。深層機械学習を用いて事前に学習された当社の文書特化型AIモデルにより、お客様は導入直後から最大90%の精度を達成できます。しかし、高速機械学習を導入することで、精度は95%以上に向上します。高速機械学習は、深層機械学習が把握できなかった外れ値を記憶し、対象となる文書の数パターンを用いて迅速に機能します。そのプロセスで収集したデータを基に、当社の深層学習モデルは継続的に進化し、時間が経つにつれて精度を向上させていきます。
深層学習を活用することで、文書処理タスクに特化したAIモデルを事前にトレーニングすることが可能になります。汎用的なLLMや幅広いタスクに対応した生成AIとは異なり、私たちの深層学習モデルは特定の目的に特化しており、より信頼性が高く、精度の高い結果を提供します。
- 深層機械学習(ML)CNN(畳み込みニューラルネットワーク)、RNN(再帰型ニューラルネットワーク)、およびNLP(自然言語処理)を活用して、半構造化文書から情報を抽出します。テンプレートに依存せず、さまざまな文書フォーマットに一般化し、未見のレイアウトを効果的に処理します。正確なフィールド抽出には500から10,000件のラベル付きデータが必要ですが、長期的な学習プロセスにより高い精度が確保され、複雑なデータ解釈において強力なツールとなります。
- 高速機械学習(ML)テキストとビジュアルのパターンに特化し、各セットで1~2件の文書から効率的に処理を行います。クラスタリング技術を使用して、類似した文書レイアウトをグループ化し、各クラスタに対してフィールド抽出モデルを内部的に学習します。深層機械学習とは異なり、このアプローチはパターンの一般化ではなく、すでに「見た」文書のバリエーションに焦点を当てています。このアプローチの明確な利点は、学習プロセスを加速し、CPUの使用を抑え、処理時間を短縮できることです。
OCR & ICR - 光学式文字認識(OCR)および手書き文字認識(ICR)
ABBYYは光学式文字認識技術のパイオニアであり、1993年に最初の「オムニフォントOCRシステム」であるABBYY FineReaderを市場に投入して以来、この分野での研究と革新を積極的に行っています。この技術は、文字の認識から単語の識別、ページ構造の再現を経て、レイアウトや複数ページにわたる構造、ヘッダー、フッター、目次などの要素を含む文書全体を理解する適応型文書認識技術(ADRT®)の適用へと進化しています。
AIの進化により、ABBYYは近年、OCRおよびICRにおけるエンド・ツー・エンドのアプローチを開発し、確立してきました。このアプローチでは、生成AIツールの基盤となる技術である畳み込みニューラルネットワーク、トランスフォーマー、言語モデルを活用しています。
畳み込みニューラルネットワークは、手書きや印刷された文書のテキスト画像をビットやバイトなどの最小単位に分解し、それが何であるかを理解しようとします。CNNからの入力データはすべてトランスフォーマーに送られ、単語の候補として結果が生成されます。次に、私たち独自の言語モデル(LM)を導入します。このモデルは数十億のパラメータで学習され、異なる単語の文脈を把握し、その情報を最大限に活用して結論に達することができます。この技術により、OCRとICRの性能と精度が飛躍的に向上し、統計的アプローチと組み合わせることでその効果を最大限に引き出します。私たちのAIは、文書の使用ケースに応じて最適なアプローチを自動的に選択し、一貫性、精度、速度をリアルタイムで最適化することで、より高いストレート・スルー・プロセッシング率を実現します。
コンピュータービジョン
ABBYYは高度なコンピュータビジョン技術をインテリジェント文書処理ソリューションの重要な要素として活用し、複雑な文書の自動化とデータ抽出を強化しています。ABBYYは畳み込みニューラルネットワーク(CNN)やトランスフォーマーなどのニューラルネットワークを統合することで、テキスト、画像、さらには手書き文書などの視覚コンテンツを処理します。CNNは文書内の視覚的要素を分解し、印刷された文字や手書きの文字のパターンを特定します。一方、トランスフォーマーは文脈を解析することで、単語や文字の認識精度を向上させます。この技術により、ABBYYは構造化されたフォームから構造化されていないテキストが多いコンテンツまで、幅広い種類の文書を正確に解釈し、分類できるようになります。
さらに、ABBYYのソリューションには、保険や物流などの業界において不可欠なバーコード、署名、スタンプなどの特徴を識別するためのオブジェクト検出技術が組み込まれています。ABBYYは、コンピュータビジョンと言語モデル、その他のAI技術を組み合わせることで、ドキュメント処理能力を向上させ、企業がワークフローをより効率的に自動化し、手作業によるエラーを減少させ、ストレート・スルー・プロセッシング率を向上させることを可能にします。
自然言語処理
ABBYYのインテリジェント文書処理ソリューションに自然言語処理(NLP)を導入することで、文書管理プロセスの最適化を目指す企業に革新的な利点を提供します。ABBYYのAI OCRプラットフォームVantageは、名前付きエンティティ認識(NER)、深層機械学習(DeepML)、要約などの高度なNLP技術を活用することで、構造化文書と非構造化文書の両方から効率的に構造化データを抽出することに優れています。深層学習機能を統合することで、このプラットフォームは独自のビジネス要件に合わせたカスタマイズ可能なNLPシステムを提供します。開発者とビジネスユーザーは、これらのシステムをトレーニングしてカスタマイズされた名前付きエンティティを認識させることができるため、特化型ソリューションを実現しながら、使用するモデルに対する透明性とコントロールを維持できます。この機能により、ビジネスオペレーションがより迅速かつ正確になります。例として、融資処理の迅速化や契約管理の効率化が実現されます。
ABBYYのNLP機能の応用は、企業環境に大きなメリットをもたらします。これには、日常的な文書作業の自動化による業務効率の向上、データ抽出の精度と信頼性の大幅な改善、そして迅速な意思決定を支える処理速度の向上が含まれます。さらに、ABBYYのソリューションは、規制基準に準拠して機密情報を正確に識別することで、コンプライアンスとデータプライバシー管理に貢献します。銀行、金融、法律、ヘルスケアなどの業界は、セグメンテーション、クエリ生成、要約などの高度な技術を特に効果的に活用できる分野です。これらのツールを活用することで、組織は生データを実用的なインサイトに変換し、顧客へのサービスを向上させるとともに、全体的な業務効率の向上を図ることができます。
NeoML
NeoMLは、深層機械学習と従来型機械学習タスクの両方に対応するために設計された、ABBYYの包括的なオープンソース機械学習フレームワークです。この汎用性の高いツールは、100種類以上のニューラルネットワーク層と20以上の従来型機械学習アルゴリズムをサポートしており、コンピュータビジョンや自然言語処理など、幅広い用途に適応可能です。NeoMLは、Windows、Linux、macOS、iOS、Androidなどのクロスプラットフォーム環境に対応しており、既存の企業インフラにシームレスに統合できます。さらに、NeoMLはOpen Neural Network Exchange(ONNX)形式に対応しており、他の機械学習ツールとの互換性を実現しています。これにより、C++、Java、Objective Cなどの言語を用いる多様なプログラミング環境での活用がさらに広がります。
NeoMLは、企業に対してさまざまな業務分野への機械学習モデルの導入を支援する、堅牢で拡張性に優れたコスト効果の高いソリューションを提供します。Apache 2.0ライセンスのもとにオープンソースであるNeoMLは、企業が高額なコストをかけることなく、自社の特定のニーズに合わせてカスタマイズできるため、リソース配分の効率を最大限に高めます。NeoMLは包括的なコミュニティサポートを受けており、継続的な改善とアップデートが行われることで、企業は最先端の機械学習機能にアクセスできます。このフレームワークは、CPUとGPUのサポートにより高いパフォーマンスを発揮し、迅速なデータ処理とタイムリーな結果を保証します。これにより、機械学習を活用してイノベーションを促進し、業務効率を最適化したい企業にとって理想的な選択肢となります。
Carlsberg
世界有数のビール会社Carlsberg、製品を出荷するまでの時間を短縮
納期の大幅短縮と顧客満足度
短縮時間(月間)
タッチレスの注文処理
U.S. FDA、IDPを活用し公衆衛生を守る
重要な情報を正確にキャプチャする割合
にも及ぶ複雑な項目を2ダースのフォームに
にわたるフォームのアーカイブ変換
プロセスインテリジェンスで顧客体験を向上
すぐに使える
改善
シュミレーション
ABBYY プロセスインテリジェンスは、データに基づいた改善を実現する真の文化変革を支援してくれました。
- Simon Higgs, Director of Business Transformation
U.S. FDA
世界有数のビール会社Carlsberg、製品を出荷するまでの時間を短縮
納期の大幅短縮と顧客満足度
短縮時間(月間)
タッチレスの注文処理
U.S. FDA、IDPを活用し公衆衛生を守る
重要な情報を正確にキャプチャする割合
にも及ぶ複雑な項目を2ダースのフォームに
にわたるフォームのアーカイブ変換
プロセスインテリジェンスで顧客体験を向上
すぐに使える
改善
シュミレーション
ABBYY プロセスインテリジェンスは、データに基づいた改善を実現する真の文化変革を支援してくれました。
- Simon Higgs, Director of Business Transformation
Emerson
世界有数のビール会社Carlsberg、製品を出荷するまでの時間を短縮
納期の大幅短縮と顧客満足度
短縮時間(月間)
タッチレスの注文処理
U.S. FDA、IDPを活用し公衆衛生を守る
重要な情報を正確にキャプチャする割合
にも及ぶ複雑な項目を2ダースのフォームに
にわたるフォームのアーカイブ変換
プロセスインテリジェンスで顧客体験を向上
すぐに使える
改善
シュミレーション
ABBYY プロセスインテリジェンスは、データに基づいた改善を実現する真の文化変革を支援してくれました。
- Simon Higgs, Director of Business Transformation
Carlsberg
U.S. FDA
Emerson
世界有数のビール会社Carlsberg、製品を出荷するまでの時間を短縮
納期の大幅短縮と顧客満足度
短縮時間(月間)
タッチレスの注文処理
U.S. FDA、IDPを活用し公衆衛生を守る
重要な情報を正確にキャプチャする割合
にも及ぶ複雑な項目を2ダースのフォームに
にわたるフォームのアーカイブ変換
プロセスインテリジェンスで顧客体験を向上
すぐに使える
改善
シュミレーション
ABBYY プロセスインテリジェンスは、データに基づいた改善を実現する真の文化変革を支援してくれました。
- Simon Higgs, Director of Business Transformation
世界の大手企業がABBYYを信頼
10,000 を超える顧客
400 以上の特許と特許出願
30 年を超える経験
信頼できるAIの原則
責任あるデータサイエンスへの取り組み
当社は、機密性、正確性、安全性といった責任あるデータサイエンスの原則に基づき、AIを活用したインテリジェント文書処理とプロセスインテリジェンスの製品ポートフォリオに組み込まれた厳格な製品開発に取り組んでいます。
個人情報の機密保持
当社は、お客様が個人情報の収集と処理を管理し、制限できるようにする「プライバシー・バイ・デザイン」の手法を取り入れています。
製品の正確性と品質の確保
当社は、AI駆動型製品ポートフォリオの開発において、情報精度に関する業界標準を満たすことを遵守しています。
業界標準のセキュリティに準拠
当社は、サイバーセキュリティリスクを最小限に抑えるために、ゼロトラストセキュリティの原則を採用して運用しています。
倫理的AIに対するABBYYのアプローチ
ビジネス価値と利便性を提供する、目的に特化したAI
- 当社は、自社のAI製品の能力に関して透明性を持って情報を提供し、お客様からのフィードバックを積極的に取り入れることにコミットしています。
- 当社は、AIリスクマネジメントフレームワークを活用し、自社のAI搭載製品ポートフォリオのライフサイクル全体を通してリスクを体系的に評価するアプローチを提供することにコミットしています。
- 当社は、データプライバシーおよびAIに関して適用される規制を遵守することを約束します。