非定型帳票OCR:同種の異なる レイアウト帳票 - キーワード との相対関係位置 - どこに 読み取りたい 値 があるか分からなくても読み取る - FlexiCapture 12 機能

非定型帳票への対応
          基本コンセプト その1:「相対位置で情報取得」

取得したい情報 を キーワード・印刷要素 からの「相対位置」で指定できます。

座標での取得も、勿論可能ですが、「相対位置」での読み取り位置を把握できることで、同じ帳票のB5、A4といった縮尺の違い、印刷のズレ、スキャン時のズレ、などを全て吸収できます

キーワード、罫線などの印刷要素の相対位置関係

キーワード が見つかれば、レイアウト が異なっていても 画像上の 印刷されている要素の 相対位置の関係 により 取得したい場所 を 特定できます。

例: ラベル の 右側

mceclip0.png

印刷物 の 関係の相対比の位置関係の指定も可能で、画像の縮尺が変化してもビクともしません。

相対位置の関係で読み取る 為、縮尺の異なり、違い、変化を吸収

同じ帳票・文書でサイズがバラバラでも、例: A3, A4, B5...  相対関係で読み取る為、縮尺の変化は関係ありません*。

*看板のような大きすぎる帳票・文書、読み取る文字が潰れるぐらい小さすぎる帳票・文書は除きます。 解像度 300 dpi 以上を推奨しております)。

mceclip6.png mceclip5.png mceclip4.png

 基本コンセプト その2:「様々な検索キーワードに対応」

一つの 帳票 固有 キーワード に対して、複数の単語を設定できます。

例) 請求書番号

mceclip3.png

基本コンセプト その3:「複数の条件に対応」

帳票 固有の情報:取得したい情報の領域は、優先順位 をつけて 複数 設定できます。

【非定型帳票】のカバー範囲を広く取れます。

例:

mceclip2.png

将棋 の 桂馬飛び のような 離れた位置 でも、かなり離れた位置でも相対関係で読み取り場所を指定可能です。


非定型帳票への対応

          基本コンセプト その4:「文字列以外のキーワードに対応」

キーワード が取得できなくても、取得できている情報 (罫線など) を元にデータ抽出が可能です。

学習ベース だと 学習 が効きにくい ケース でも、この方法なら安心です。

キーワード が 潰れていて認識できないケースも    mceclip5.png

縦線、横線をキーワードとすることにより、領域指定が可能!

mceclip6.png

線 の他に、空白 領域や バーコード なども キーワード として活用できます。

はっきりとした罫線 が使われている帳票では、場所を探す為に人間が帳票を見る際に罫線を頼りにするのと同じように FlexiCapture も罫線を利用でき、読み取り場所を探すことができます。

強力なOCRアプリケーション ABBYY FlexiCapture 12 について、是非お問い合わせ下さい!

この記事を読んだ人はこんな記事も読んでいます。

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

記事コメントは受け付けていません。