AI OCRソリューション選択時の評価ポイント

近年DX(デジタルトランスフォーメーション)やRPAといったキーワードが話題となり、様々な企業が取り組みを行っています。中でも重要な役割を担う技術がOCR(Optical Character Recognitio、光学文字認識)ですが、本コラムではOCRソリューションを選択する際に重要なポイントについて触れたいと思います。

またその中で、ABBYY製品が活躍している領域やその特徴をご紹介いたします。

 

1. OCRとは

OCRとはOptical Character Recognitionの略で、光学文字認識ともよばれます。文字を含む画像を利用可能なデジタルデータである文字情報に変換する技術です。ビジネスで利用されるOCRソリューションとしては、大きく分けて以下の2種類があります。

 

  • 全文OCR

画像に表示されている情報(文字、表、画像、等)を全て認識し、デジタル化する。Officeドキュメント(ワード、エクセル、等)へのドキュメント変換に利用されることが多い。ABBYY製品としては、ABBYY FineReader PDF(個人向け)やABBYY FineReader Server(企業向け)などがある。

 

  • 帳票OCR

画像から必要な文字情報を取得・認識し、デジタル化する。RPA等で利用されるソリューションとしてはこちらが多い。代表的な利用例としては請求書処理があり、スキャンした紙の請求書から必要な情報(会社情報、金額、日付、等)を取得し、社内システムやRPAの入力とする。ABBYY製品としては、ABBYY FlexiCaptureがある。

 

ここからは特に、DX, RPAで利用されている帳票OCRについて、ソリューション選択時の評価ポイントについて触れたいと思います。

 

2. 帳票OCRソリューションの評価ポイント

帳票OCRソリューションを選択する際、評価ポイントとして何に注目されてますでしょうか?多くの方が認識精度を第一に挙げられるのではないでしょうか。実は、これは非常に危険です。弊社でも、これまで認識精度に着目してOCRソリューションを選定した結果、思うように導入効果が出ず何とかしてほしい、といった相談を頂戴する事が多数ありました。なぜこのようなことが起こるのでしょうか。以下では、主な原因について説明いたします。

 

  • 認識精度の定義について

認識精度というと文字毎の認識率を思い浮かべる方が多いかと思いますが、帳票OCRにおいては異なります。

帳票OCRでは以下のような利用プロセスが一般的ですが、目検(確認・修正)時の作業効率に大きな影響を与えるのは実は文字毎の認識率ではなく、「仕分け~項目抽出~項目内の文字認識」といったトータルでの抽出精度となります。例えば、仕分け時に誤分類が発生すると、後続の処理全てについてやり直しまたは修正が必要となってしまう事になります。

 mceclip0.png

  • ROI(費用対効果)について

上記プロセスを想定するとお分かりいただけるかと思いますが、実は文字毎の認識精度が数%違っても全体のROIへの影響はほとんどありません。それよりも、仕分け・項目抽出等トータルでの精度、確認・修正のしやすさ、処理性能、他システム連携のしやすさ等、プロセス全体で効率化が図られるかを評価する必要があります。

 

以上より、帳票OCRソリューションを選択する際の基準としては、以下のようなポイントが挙げられます。これらの中からProjectの要件に応じて取捨選択をし、評価・ジャッジをすることが重要です。

 

【帳票OCRソリューション選択時の評価ポイント】 

- 「仕分け~項目抽出~項目内の文字認識」トータルでの認識精度

- 「インポート~目検~出力」機能・UI

- 他システム連携性(必要な場合)

- 処理性能(高トランザクションの場合)

- 開発・メンテナンスコスト

 

3. ABBYY FlexiCaptureの強み

帳票OCRソリューション選択時の評価ポイントをふまえ、FlexiCaptureの評価が特に高いポイントについてご紹介いたします。

 

多種多様な帳票について、柔軟な設定(帳票定義)により高精度の読み取りを実現

ビジネスの現場ではレイアウトが単純ではない帳票が多数見受けられますが、このようなケースでは簡単な設定や学習だけでは期待通りの情報を取得できない事があります。そのような場合でもFlexiCaptureであれば柔軟かつ高度な設定(帳票定義)により正しく情報を取得する事が可能です。

 

例1: 表(テーブル)レイアウトが複雑なケース

 mceclip1.png

 

例2: 帳票のレイアウトが異なる複数ページにわたる明細の読み取り

 mceclip2.png

 

簡単かつ高精度な仕分け機能

先程お話しした通り、自動仕分けの精度はプロセス全体に大きな影響を与えます。

ABBYY FlexiCaptureには簡単な操作で高精度な仕分けを実現する機能があり、世界中で利用されています(数百~数千の帳票仕分けの実績多数)。

 

例3: AIで高精度な自動文書仕分け

 

 柔軟にカスタマイズ可能な検証ツールやワークフロー

帳票OCRソリューション単体で実際の業務フローにあったワークフローを実現できるかどうかは、開発・メンテナンスコストに大きく影響します。

ABBYY FlexiCaptureは、複数オペレータによる共同作業、複数の検証(目検)ステップ、条件に応じた特定イベント作成等、柔軟にワークフローをカスタマイズ可能な他、検証そのものについても、UIのカスタマイズ性が高く、また様々なカスタムルール(自動補正、フォーマットチェック、等)も設定可能であるなど、多種多様な要件を満たすことができる唯一無二のソリューションとなります。

 

例4: 候補からの選択

例5: ワークフローのカスタマイズ

例6: オペレータによる修正を次回から反映させる

 

他システム・アプリケーションとの連携機能

FlexiCaptureの大きな特徴として、様々なシステム・アプリケーションとの連携機能が挙げられます。例えばSAP, Salesforce, SharePointなどの他、UiPath, WinActor, Blue PrismなどのRPA製品とも接続可能です。

その中でも特殊な例としては、以下の記事のようにOCRエンジン自体も外部エンジンと連携する事例もあります。

※FlexiCaptureは日本語手書き認識をサポートしていないため、外部手書きエンジンと連携する事例となります。

 

例7: 外部手書きエンジンとの連携

 

4. まとめ

本コラムでは、帳票OCRソリューション選択時の評価ポイントについて紹介しました。これらのポイントを踏まえ、適切なソリューションを選定することが非常に重要となります。また評価にあたり、ABBYY FlexiCaptureが選択肢となるような場合は、是非弊社までご連絡頂ければ幸いです。

 

この記事を読んだ人はこんな記事も読んでいます。

 

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

記事コメントは受け付けていません。