インテリジェント文書処理とはどんなもので、その仕組はどうなっているのか?
Maxime Vermeir
2024年10月25日
インテリジェント文書処理というとすごく近代的に聞こえるかもしれませんが(実際そうですが)、そのルーツは初期の光学式文字認識(OCR)ソリューション開発に遡ります。現在、インテリジェント文書処理は、人工知能ベースの機能を備えており、定型、準定型、非定型など、あらゆる種類の文書から、あらゆる業界のあらゆるプロセスのあらゆる種類のデータ処理をできます。このブログでは、インテリジェント文書処理の仕組みや使用例などをご紹介しています。さらに、インテリジェント文書処理に関するよくある質問も取り上げ、インテリジェント文書処理を活用してビジネスを変革する方法を詳しくご説明しています。
以下に移動します:
インテリジェント文書処理(IDP)とは?
IDPの真相
IDPの進化
仕組み
メリット
使用例
正しいIDPソフトウェアの選び方
よくある質問
インテリジェント文書処理(IDP)とは?
インテリジェント文書処理(IDP)は、定型、準定型、非定型の処理に人工知能(AI)と機械学習技術を応用し、テクノロジーが人間のように文書内のコンテンツを読み取り、処理することを可能にします。
ここ数年で技術は進化を遂げ、自然言語処理 (NLP) などより高度な機能を取り込むようになりました。これにより、文書処理は単純な文字認識を超えて、変換対象のテキストがある程度の理解が可能になりました。しかしながら、このような進歩があったにも関わらず、IDP は長年、売り上げに直結する顧客、サプライヤー、従業員との関わりとは切り離された、メールルームや BPO の一機能として扱われてきました。
今日、こうした従来のアプローチは、最新のインテリジェント文書処理に取って代わりつつあります。従来のソリューションは主にテキストやフィールドデータの抽出に焦点を当てていましたが、IDPは顧客や従業員のエクスペリエンスの一部としてコンテンツを使用した処理を可能にします。それは、これらのプロセスを再考することから始まります。そして、最新のAIベースの文書処理「スキル」を活用して、コンテンツをまさに必要とされる時、必要とされる場所で、即座に利用可能で実行可能な状態にすることを目指しています。
ABBYYのローコード/ノーコードIDPソリューションの詳細については、こちらをご覧ください。
IDPの真相
IDPが何であるか、企業にどのようなメリットをもたらすのかを理解する上で、IDPの真相を理解することも同様に重要です。
- IDPは単なるOCRやデータキャプチャではありません。IDPはOCRとデータ・キャプチャ・テクノロジーを組み込んでいますが、これらは専門的な技術と意思決定をコンテンツの処理に追加する壮大な機能の一部に過ぎません。
- IDPはロボティック・プロセス・オートメーション(RPA)ではありません。RPAは、データ上で実行される定義されたプロセス内の個別タスクの自動化を行うものです。コンテンツはこのようなデータの源であるため、コンテンツからデータを抽出する前に文脈を理解することが不可欠です。そしてそれがさまざまな下流プロセスで使用されていきます。ロボティック・プロセス・オートメーション単独ではこれを実行できないため、コンテンツに関する熟練した判断を下すためにIDPのサポートが必要となります。
- IDPはChatGPTとは違います。ChatGPTは光学式文字認識(OCR)と同じものだと思っている人が多いのですが、実際はそうではありません。ChatGPTはディープラーニング・アルゴリズムを使用して、ユーザーのクエリに対して人間のようなテキスト応答を生成する自然言語処理(NLP)モデルのことを指しています。一方、ABBYY Vantageは、光学式文字認識(OCR)技術を使用して、請求書、注文書、契約書など、さまざまな種類の文書からデータを抽出するIDPソリューションです。
IDPの進化
インテリジェント文書処理の仕組みとは?
IDPは、自然言語処理(NLP)技術と周囲のテキスト文脈データを使用してエンティティを抽出し、どのエンティティが参照されているかを自動的かつ高い精度で判断します。例えば、「ジャガー」という言葉は、動物のジャガーを指しているのか、それとも車メーカーを指しているのかを判断します。あるいは、「訴える」という言葉が、人が何かを訴えかけること指すのか、それとも法的行為を指すのかを判断します。NLPを適用することで、構造化されていないデータの前例のない認識が識別・抽出され、人間の脳のように動作し、変化する入力に素早く適応し、可能な限り最良の結果を生み出すことができます。
高速学習メカニズムであるFastMLを搭載することにより、視覚的およびテキスト重視の抽出方法が適用され、データ抽出の精度がさらに向上します。競争優位を維持したい企業は、煩雑で事務的、大量のコンテンツ処理業務をインテリジェント・ドキュメント・プロセシング (IDP) やインテリジェント・オートメーション・ソリューションに移行させることで、従業員の時間をより付加価値の高い業務や顧客体験向上のために解放することができます。
インテリジェント文書処理にはどんなメリットがありますか?
あらゆる業界において、企業は、より少ないスキルリソースで、より多くのことを、より迅速にこなさなければならないというプレッシャーに直面しています。同時に、収益、利益率、定着率を向上させる鍵として、顧客や従業員の体験を改善することに注力する組織も増えています。インテリジェント文書処理(IDP)は、この両面で大きなメリットをもたらすことができます。人がコンテンツを理解し管理する方法に極めて近い形で文書スキルを応用することで、IDPは以下のようなメリットをもたらしてくれます。
- 作業効率 : 手作業によるデータの抽出と入力は、時間とコストがかかります。IDPは時間とお金を節約すると同時に、コストのかかるエラーのリスクを軽減します。
- コンプライアンス : IDP はヒューマンエラーのリスクを低減し、企業のコンプライアンス向上に寄与します。IDP による自動処理はデジタル監査証跡を残し、ログは監査の際に活用できるため、コンプライアンス関連タスクの管理が容易になります。
- 顧客体験(カスタマーエクスペリエンス) : IDPを使えば、従業員は文書を読んだり手作業で処理したりする面倒な作業から解放されます。一方、取引先は会計処理や請求処理、事例処理といった文書中心のプロセスにおける意思決定の効率化を図ることができます。
- 拡張性 : IDPは拡張性が高く、機能横断的に拡大することができます。IDPソフトウェアは、1つの文書タイプ(請求書など)を処理するようにトレーニングすることもできれば、100種類以上の異なるドキュメントタイプ (請求書、クレーム、銀行明細書、オンボーディング、レシートなど) を取り込み、数千件のドキュメントを毎分処理するようにトレーニングすることもできます。
関連コンテンツ: 顧客オンボーディングの推進要因とペインポイントに関するインテリジェント・オートメーションの現状レポート
プロセスマイニングとIDPを組み合わせることで、どのように価値を高めることができるのでしょうか?
コンテンツは単独で存在するわけではなく、あらゆる業界の組織が日々の業務を遂行する上で不可欠なビジネスプロセスの不可分の一部です。コンテンツは意思決定や顧客体験という大きな枠組みの中で重要な役割を果たしているため、単に従来のプロセスにインテリジェント・ドキュメント・プロセッシング (IDP) を導入するだけでは、せいぜい限定的な成果しか得られません。なぜなら、従来のプロセスはIDPを想定していないからです。したがって、IDPを成功させるためには、最適化されたデジタルプロセスに適用する必要があります。ここでプロセスマイニングが登場するのです。
プロセスマイニングは、企業がプロセスをマイニングして、文書処理を自動化する場所をスマートに決定できるようサポートします。情報システムからタイムスタンプデータを抽出し、AIを適用して、すべての逸脱を含むプロセスの開始から終了までのビジュアルモデルを構築します。プロセスオーナーは、コンテンツがどのようにプロセスを流れるかを明確に把握できるようになり、IDP導入の成功を妨げる可能性のある非効率性を特定し、それに対処するために必要なインサイトを得ることができます。
自動化を成功させるための基礎として、プロセスマイニングはIDPと連動し、ビジネスにおいて以下のようなことを可能にします。
- プロセスを理解し、コンテンツの可能性を探ること
- コンテンツがプロセスにおける熟練した意思決定の基礎としてどのように機能するかを洞察すること
- プロセスをよりうまく機能させるために、コンテンツをどのように扱うべきかを決定すること
- コンテンツ処理を最適化するためには、必要な文書スキルを適用します
IDPの使用例: データとプロセスをデジタル的にマスターする
インテリジェント文書処理アプリケーションには、さまざまな使い道があります。それをうまく活用すれば、タイミングを問わず、あらゆる言語、あらゆるフォーマットの文書をインテリジェント・オートメーション・ソリューションに取り入れることができます。IDPの活用方法における例として、保険、顧客オンボーディング/KYC、物流、ローン処理における4つのユースケースをここにご紹介します。
保険業界におけるIDP
保険業界におけるインテリジェント文書処理は、様々な方法で利用できます。例えば、「ハンズフリークレーム」のような自動化された意思決定、通常はコールセンターが対応する質問回答におけるスマートなデジタル・セルフサービス・オプションの提供などが挙げられます。こうしたデジタルプロセスの自動化により、従業員は雑務から解放され、お客様の気持ちに寄り添った接客が可能になり、顧客体験(カスタマーエクスペリエンス)の向上に集中することができます。
多国籍保険ブローカーであるEcclesia Groupは、ABBYYのインテリジェント文書処理ソリューションを活用することで、通信文書管理をデジタル化して合理化し、顧客体験の向上を実現しました。ABBYY IDPは、スキャンした保険金請求文書からケース番号やナンバープレートなどの重要なデータを抽出し、文書を顧客データベースの関連項目と正確に照合し、その後の処理を行う適切な管理者に文書を自動的に転送します。
顧客ローン処理におけるIDP
住宅ローン申請書は、ローンフォルダ1つあたり100~200ページを占める、容量的に大きな負担を要する書類の典型例です。必要な情報には、運転免許証、出生証明書、住所証明書、公共料金の請求書、銀行の明細書、給与明細書などがあります。インテリジェント文書処理は、各文書内の情報を自動的に取り込み、読み取り、理解し、検証することで、プロセス全体を合理化し、データが正確で真正であることを確認することで、ローンを迅速に承認できます。全プロセスをオンラインとモバイルで管理できるため、顧客体験が向上し、利便性も増します。
さらに優れているのは、IDPの規模拡大能力です。融資申し込みが急増する景気後退期には大きな威力を発揮します。パンデミックの最中、あるスペインの銀行は融資を求める顧客から送られてくる2000万ページという途方もない書類を処理する必要があり、ピーク時には1日に10万ページ以上もの書類を処理していました。この銀行は、ABBYYのインテリジェント文書処理技術のサポートを受けることで、ロックダウン最中にあった6週間以内にすべてのタスクを完了することができました。銀行業界のプロセス自動化をリードするスペイン企業Serimag社は、ABBYYのIDPプラットフォームを活用することで、数百万のローン申請書からテキストを迅速かつ正確に抽出できるようになりました。これによりSerimag社の努力は報われ、全プロセスの75%を自動化することができただけでなく、結果のSLA精度を99%以上にまで引き上げることにも成功しました。
顧客オンボーディング/KYCにおけるIDP
IDPを顧客のオンボーディングとKYC(Know-your-customer)コンプライアンスに利用することで、金融サービスは顧客体験を向上させ、効率を高め、収益を促進し、コストを削減することができます。
Serimag社は、スペインの銀行がCOVID-19の影響を軽減するために、ローン申請プロセスにおける複雑なサポート文書を管理するインテリジェント文書処理(IDP)サービスに、業界をリードするABBYYのIDPテクノロジーを取り入れました。ABBYYのIDP機能は、激動期にあった重要なプロジェクトで予想された結果を達成し、全プロセスの75パーセント以上を自動化しました。
物流分野におけるIDP
書類作成にミスがあると、貨物が途中で止まってしまったり、必要な商品の配達が大幅に遅れたりする可能性があります。インテリジェント文書処理は、税関申告書、納品書、船荷証券、運転手のログなど、あらゆる出荷書類を自動的に処理することで、正確性と作業効率をもたらします。
世界的なロジスティクス企業であるドイツポストDHLグループは、小包や速達郵便を世界中に配達しており、財務部門を自動化することで顕著な成果を上げています。
2022 年の売上高が 1,000 億米ドル(130 兆円以上)に達する企業ですが、以前は毎年数十万件の請求書を処理するために、非常に手作業に依存した会計システムを採用していました。しかし、ABBYY のインテリジェント・ドキュメント・プロセシング (IDP) を導入したことで、124 種類の仕入先から発行される多言語の請求書を自動的に処理できるようになり、エラーの削減と生産性の向上を実現しました。さらに、この IDP 自動化プロジェクトの成功を受けて、DHL グループは効率をなんと 70% も向上させるため、他の部門にも展開しました。
インテリジェント文書処理ソフトウェアの正しい選び方
人工知能をめぐる色々な宣伝が出回り、テクノロジーも絶え間なく進化する中で、適切なインテリジェント文書処理ソフトウェアを選択することは、ビジネスプロセスの最適なデジタル変革を図るうえで重要な決断です。その際に考慮すべき重要ポイントは以下の通りです。
- ビジネスのニーズを的確に把握しましょう。
画一的なアプローチでは決してうまくいかないので、具体的な要件について明確に考える必要があります。あなたが具体的に達成しようとしていることは何ですか? 顧客体験の向上、生産性の改善、タッチレスのストレートスルー処理、あるいは従業員の燃え尽き症候群の軽減ですか? 良いROIの達成には適切な価格で適切なプラットフォームを選択するために、IDPへの投資の明確な目標を最初から定義する必要があります。予測される成果、生産性の向上、統合の容易さ、ユーザーへの適応性、拡張性、従業員トレーニング、さらにはセキュリティやコンプライアンス(特に倫理的AIに関する新しい法律の導入に伴うもの)などについて、候補となるベンダーへの詳細な質問を準備します。 - 処理する必要があるデータを特定しましょう。
業種によって、処理する必要のあるデータや文書の種類は異なります。保険会社の保険金請求処理、法律事務所の法律文書、銀行のローン申請、商業不動産業者の契約管理などです。インテリジェント文書処理は、さまざまな種類の文書を処理できるようにカスタマイズし、トレーニングすることができます。必要なデータは、標準的なフォームやテーブル上の情報、または会社のデータベースやソフトウェアプラットフォームに対応するフィールドのような構造化ができます。しかし、非構造化データ、例えば電子メール内のコピー、テキストメッセージ、グラフィックなどを処理する必要があるかもしれません。したがって、IDPプラットフォームを選択する前に、どこで、どのような種類のデータを扱うのかを正確に知ることが極めて重要です。 - 要件に合ったソリューションを探しましょう。
具体的なニーズを見極めれば、要件を満たすソリューションを見つけるのは簡単になります。例えば、異なる言語のデータがあり、それを分析したり他のシステムに転送したりする前に翻訳する必要があるかもしれません。データの使用については、厳格なプライバシーガイドラインが存在する可能性があるため、IDPソフトウェアプラットフォームの認証・検証機能は最優先事項となります。データの分類や統合も、既存のワークフローに自動的に移行するための重要な要素です。例えば、アプリケーションを日付順に並べ替えたり、電子メールを内容に応じて異なるフォルダに分類したりすることができます。
文書処理の未来
戦略的に実装されたインテリジェント文書処理は、顧客体験の重要な助っ人です。そのプロセスが構築されたら、ビジネスの利益面において多大なメリットをもたらしてくれます。まずプロセスマイニングを活用し、導入のための強固な基盤を構築することで、企業は、コスト削減や効率性の向上、法規制への対応、従業員や顧客のエクスペリエンス向上など、IDPのメリットをフルに享受することができます。
ABBYYの市場をリードするテクノロジーは、ローコード/ノーコードのアプローチで提供され、デジタルワークフォース向けの新しいインテリジェント文書処理プラットフォームであるABBYY Vantageの基盤となっています。
当社ABBYYは、長年の経験を通じて、お客様がすぐに活用できる事前学習済みのスキルを渇望していることを学びました。そこで登場したのが、ABBYY Marketplaceです。このオンラインデジタルコミュニティでは、お客様がABBYYのインテリジェント文書処理プラットフォームに付加価値を与えるスキルやその他の技術資産のダウンロードができます。
Vantageでは、ドキュメントスキルモデルをトレーニングして作成できるため、OCRや機械学習の専門家である必要はありません。レビューにおける人間のインタラクションは、オンライン学習を促進し、お客様のモデルを改善することに繋がります。そして、ソリューションの規模を拡大し、多くの事業分野にこの技術を適用するための鍵は、さまざまな文書の種類やバリエーションに適応できるようにすることです。
デジタルトランスフォーメーションを加速し、文書プロセスの自動化を変革する準備はできていますか?
よくある質問
IDPとOCRの違いとは?
光学式文字認識(OCR)の歴史は古く、データキャプチャに関連する技術として認識されています。主に紙の文書、スキャンした画像や写真からテキストを抽出し、コンピュータ上でデジタル編集できるテキストに変換するために使用されます。この技術は、一般的に印刷された文書をデジタル化し、ウェブページなどで電子的にアクセスできるようにするために使われます。
しかし、OCRはテキストの意味を理解することはなく、ただ文字を認識することに集中します。一方、IDPはより幅広い能力を有しています。OCRによる文字認識だけでなく、人工知能や機械学習を取り入れることで、テキストの意味を読み取り、その価値に基づいて決定を下し、それをどう扱うべきかを理解することができます。例えば、請求書を読み取り、それに関連する発注書と比較し、合計が正しいかどうかを比較した後で、支払い処理を行う適切な担当者に転送ができます。
インテリジェント文書処理と自動文書処理の違いは?
簡単に言えば、自動文書処理(ADP)はインテリジェント文書処理(IDP)ほど賢くありません。ADPは、アルファベット順の並べ替え、情報の抽出、検証など、文書に関連する定型的な反復作業を処理できます。しかし、通常はルールベースのアプローチをとり、同じレイアウトの構造化された文書にしか対応していません。つまり、非定型文書や準定型文書では、内容がさまざまで、デザインも異なるため、苦戦を強いられる可能性が生じてしまいます。過去に出会ったコンテンツに順応し、学習することができません。
一方、AIと機械学習を活用したインテリジェント文書処理があれば、はるかに幅広い複雑な文書の処理が可能になります。インテリジェント文書処理では、人間のように考えるための認知能力が基盤として加えられています。IDPは、文書内のさまざまなレイアウト、構造、内容を学習して適応し、それに応じて調整することができます。微妙なニュアンスに出くわしたとしても、何をすべきかを理解し、失敗から学ぶことができます。このため、構造化されていないデータや、従うべきパターンがないデータの処理にも難なく対応できるため、多様で変化し続けるドキュメントを扱う企業にとって IDP は最適なソリューションなのです。
IDPとRPAを組み合わせるメリットとは?
RPAは、反復的で単純なビジネスプロセスを自動化するための従来型ソフトウェアです。データの入力、取り込み、情報の検証、文書の更新といった基本的なタスクをこなすことから、「人間が椅子を回すように単純作業を繰り返す」自動化 とも呼ばれます。RPAに欠けているのは、扱う情報を理解し、それを文脈に当てはめる頭脳です。そこでIDPの出番です。
インテリジェント文書処理は、RPAが読み取ったデータの意味を理解するための認知スキルを提供し、企業がより賢くビジネス上の意思決定を行うための重要な情報を引き出すことができます。この2つを組み合わせることで、自動化プロセスに人のような理解を加え、オペレーショナルエクセレンスとビジネスの成長を促進する、よりインテリジェントで効率的なオートメーションソリューションを生み出すことができます。
この2つの技術を連動させることで、データ抽出の精度を高め、ストレートスルー処理率を向上させ、人的介入の必要性を減らすことができます。そうした業務から解放されたスタッフは、収益を創出する、より有意義な業務に専念ことができます。
インテリジェント文書処理を活用すべき企業は?
大量のデータや文書を扱う組織であればどんな業界でも、インテリジェント文書処理(IDP)の恩恵を受けることができます。IDPは、手作業、反復作業、雑多な作業を減らし、精度を向上させ、生産性も高めることができます。ビジネスデータの80~90%は非構造化データであると推定されています。これらの情報を活用しなければ潜在的な収益を失ってしまいます。IDPは、あらゆる業界の効率と収益の向上に大きな違いをもたらすことができます。
IDPは、銀行分野では融資の申請を合理化し、医療分野では患者の記録や保険請求を管理してくれます。物流分野では注文や配達のための手作業によるデータ入力を省いてくれ、それにより数百万ドルにもおよぶ経費削減に貢献しています。また、政府部門においては、運転許可証の割り当てや社会保障費の支払いを迅速化しています。実際、あらゆる業種において、経理部門はIDPを利用することで最大90%のストレートスルー処理率を確保することができています。その結果、大幅なコスト削減ができ、従業員は単純作業から解放され、より有意義な業務に専念することができます。
編集部からの注記: このブログは2021年12月8日に掲載され、2023年8月28日に更新されました。記事の中では、インテリジェント文書処理とは何かについての明確な定義や、ChatGPTのようなジェネレーティブAIモデルとの違い、さらに近代的な4つのIPPユースケースが紹介されています。記事の内容はきっと、お客様のデジタルトランスフォーメーションにとって有益なものとなるでしょう。