サポートされていない言語でのプロジェクト設定 - FlexiCapture for Invoice

質問

FlexiCapture for Invoiceにサポートされてない言語で文書を処理できますか。

回答

FlexiCapture for Invoice の言語設定を変更することで、サポートされてない言語での動作検証を行う事が可能です。本記事では、その手順を紹介いたします。

【注意】

サポート外の言語については、チューニングや学習、テストを実施してない背景から、情報の取得精度については、バラつきが出る場合があります。

検証環境

  • OS:Windows 2012R2(言語:日本語)
  • FlexiCapture Version:12.0.3.2634
  • 検証言語:中国語

手順

  1. FlexiCapture for Invoiceでプロジェクトを作成します。

    mceclip0.png

  2. 必要に応じて、文書定義名を変更します。

    mceclip1.png

    文書定義は、基本、以下の理由から言語(国)毎に設定することを推奨します。

    • 言語に依るチューニング効果が期待できること
    • 他言語の影響が無く既存環境の識字率を保つことができること
    • 問題発生時の切り分けがし易いこと

    文書定義を言語毎に分ける場合、運用の際は、プロジェクトやバッチタイプ等で分ける利用が想定されます。

  3. 文書定義エディタにて、文書定義を開き、「文書定義メニュー > 文書定義プロパティ:請求書の設定 タブ」を開きます。

    ここで、「国と言語」の「編集」ボタンをクリックします。

    mceclip2.png

  4. 「国と言語」の画面で、「国:Japan」を選択「複製」ボタンをクリックします。

    mceclip3.png

  5. 「国名を選択」画面で、「中国」を選択します。

    mceclip4.png

  6. 「中国 設定」画面が表示されます。

    「中国繁体字」を選択、「追加」ボタンをクリックします。

    mceclip5.png

  7. 「言語キーワード」画面が表示されるので、以下の項目に対して、「追加」ボタンから値を入力します。

    mceclip6.png

    設定例:

    見つかった要素

    キーワード

    備考

    InvoiceNumberHighConfidenceLabels

    發票號碼

     

    AmountTotalHighConfidenceLabels

    總計

     

    AmountTotalNettoLabels

    銷售額合計

     

    AmountTotalTaxLabels

    營業稅

    複数項目追加

     

    營業稅額

     

    LineltemsDescriptionLabels

    品名

     

    LinelternsQuantityLabels

    數量

     

    LineitemsUnitPriceLabels

    單價

     

    LineltemsTotalPriceBruttoLabels

    金額

     

    上記作業が完了したら、今度は、「中国簡体字」を選択し、「追加」ボタンをクリックし、再度上記設定を反映します。

  8. 「中国 設定」画面で、「キーワードタブ」に移動し、見つかった要素の項目にて、不要な日本語キーワードを削除し、必要と思われる、中国の用語を反映します。

    mceclip7.png

    今回の検証では、以下の様な設定を行いました。

    見つかった要素

    キーワード

    合計

    TotalAmountDue

     

    合計

     

    銷售額合計

     

    總計

    税合計

    税額

     

    營業稅

     

    營業稅額

    IBAN

    IBAN

    VATID

     

    国内VATID

     

    銀行コード

     

    銀行口座

     

  9. 必要に応じて、「中国 設定」画面で、「税率 タブ」、「税グループ タブ」、「通貨 タブ」等の設定・変更をして下さい。

  10. 設定が完了し、「国と言語」画面迄、戻ったら、「国:Japan」のチェックを外します。

    すると、「言語:日本語」が自動的に、削除されます。

    「国と言語」の画面、「国」のリストに、先の手順で「複製」した際の「中国」が追加されていることが確認できます。

    mceclip9.png

  11. データセットの設定:

    文書定義プロパティ画面に戻りましたら、「データセット」タブに移動し、「vendor」の登録を行います。

    補足:

    • Vendorの登録は、文字コードに留意してご登録下さい。

    mceclip10.png

以上で、検証する為の設定手順は完了です。文書定義を「公開」し、動作をご確認下さい。

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。

最近の閲覧