文書の先頭ページだけをOCRする方法

質問

文書の先頭ページのみをOCRして他のページを無視する方法はありますか?

回答

2つの方法があります。

① 付録ページ
文書定義エディタープロパティで、「付録ページを有効化」を有効にします。

※「付録ページ」と文書定義の「セクション」の数を適切に変更してください。

文書定義がマッチングできないページが不明なページとして、付録ページになります。

この方法では「認識」が必要ですので、「付録ページ」だとしてもライセンスの残ページ数は減ってしまいます。

② カスタムスクリプトステージの作成

もう1つの方法は、認識ステージ前のカスタムスクリプトステージを作成することです。

バッチから不要なページを自動的に削除※して、1枚目のページのみを残すことができます。サンプルコードスニペットは以下となります。

※この方法ではさい

削除したくない場合はこちらの記事をご覧ください

複数ページ画像の最初のページだけ処理し、ページカウント消費を節約する:FlexiCapture Distributed

while(Batch.Documents.Count>1)
{
FCTools.ShowMessage("Overall:" + Batch.Documents.Count.ToString());
Batch.DeleteDocument(Documents[(Documents.Count)-1]);
FCTools.ShowMessage("Currently Deleting" + Documents.Count.ToString());
}

カスタムスクリプトステージの作成方法:

この方法では、複数ページのある複数のPDFを1つのバッチにインポートする場合でも、1つ目インポートファイルの先頭ページだけが残ります。

追加情報

付録ページのある文書定義について:

https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/doc_annexes

スクリプトステージ作成の詳細について:
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/ibatch
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/workflow_project_settings
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/workflow_stages
https://help.abbyy.com/ja-jp/flexicapture/12/distributed_administrator/scripts_handling

関連する記事

複数ページ画像の最初のページだけ処理し、ページカウント消費を節約する:FlexiCapture Distributed

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。