質問
AI自動学習による文書仕分け(分類)方法を教えてください。
回答
FlexiCaptureにおける文書仕分け(分類)方法はいくつかありますが、本記事では、その中でも最も簡単かつ強力なAI自動学習機能を用いた方法をご紹介します。
文書仕分けの設定・確認方法は次の4ステップになります。
1. 文書定義作成
仕分け結果の格納先となる文書定義(FlexiLayout)を作成します。
2. 仕分け用トレーニングバッチ作成、学習用画像読み込み
プロジェクト設定ステーション(スタンドアロン版の場合は管理者ステーション)で、表示 > 仕分け用トレーニングバッチを選択し、そこで新規バッチを作成します。
作成したバッチに、学習用のサンプルイメージを読み込みます。
各画像を右クリック > クラスを設定を選択し、仕分けしたい文書定義を選択します。
同様に、右クリック > 文書状態を設定により、「学習用」「テスト用」を選択します。
※トレーニングには、クラス毎に最低3ドキュメント(学習用)が必要となりますが、実運用には数十~数百が推奨となります。
必要に応じて、仕分けトレーニングの優先度設定を変更します。
3. 仕分けトレーニングとトレーニング結果の設定
ステップ2で仕分けトレーニングの準備が整いましたので、プロジェクト > 仕分けトレーニング > 学習によりトレーニングを実行、結果を確認します。
結果に問題なければ、トレーニング結果を認識処理時に適用する設定を実施します。プロジェクト > プロジェクトのプロパティ > 認識 > 分類で、「ページを分類する > 分類子を使用する」にチェックし、設定したトレーニングバッチを選択します。
4. 作業バッチで結果を確認
作業バッチでテスト画像を読み込み、正しく仕分けが行われていることを確認します。
以上、本記事では(AI自動学習機能を用いた)簡単な文書仕分け設定方法をご紹介しましたが、次のように、より高度な仕分け設定を実施したい場合は、Online Helpをご参照ください。
- 複数ページ構成文書の仕分け
- 文書種類が多数(例:100種類以上)の場合
- 文書種類は同じ(例:請求書)だが、より細かく(例:発行元毎)に仕分けしたい場合
- 仕分け精度をより高めたい場合
最後に、今回ご紹介した内容をまとめたビデオ及び使用した画像サンプルを添付いたしましたので、必要に応じてご参照ください。
コメント
0件のコメント
サインインしてコメントを残してください。