質問
文書の先頭ページのみをOCRして他のページを無視する方法はありますか?
回答
2つの方法があります。
① 付録ページ
文書定義エディタープロパティで、「付録ページを有効化」を有効にします。
※「付録ページ」と文書定義の「セクション」の数を適切に変更してください。
文書定義がマッチングできないページが不明なページとして、付録ページになります。
この方法では「認識」が必要ですので、「付録ページ」だとしてもライセンスの残ページ数は減ってしまいます。
② カスタムスクリプトステージの作成
もう1つの方法は、認識ステージ前のカスタムスクリプトステージを作成することです。
バッチから不要なページを自動的に削除※して、1枚目のページのみを残すことができます。サンプルコードスニペットは以下となります。
※この方法ではさい
削除したくない場合はこちらの記事をご覧ください
複数ページ画像の最初のページだけ処理し、ページカウント消費を節約する:FlexiCapture Distributed
while(Batch.Documents.Count>1)
{
FCTools.ShowMessage("Overall:" + Batch.Documents.Count.ToString());
Batch.DeleteDocument(Documents[(Documents.Count)-1]);
FCTools.ShowMessage("Currently Deleting" + Documents.Count.ToString());
}
カスタムスクリプトステージの作成方法:
この方法では、複数ページのある複数のPDFを1つのバッチにインポートする場合でも、1つ目インポートファイルの先頭ページだけが残ります。
追加情報
付録ページのある文書定義について:
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/doc_annexes
スクリプトステージ作成の詳細について:
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/ibatch
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/workflow_project_settings
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/workflow_stages
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/scripts_handling
コメント
0件のコメント
サインインしてコメントを残してください。