質問
FlexiCapture for Invoiceにサポートされてない言語で文書を処理できますか。
回答
FlexiCapture for Invoice の言語設定を変更することで、サポートされてない言語での動作検証を行う事が可能です。本記事では、その手順を紹介いたします。
【注意】
サポート外の言語については、チューニングや学習、テストを実施してない背景から、情報の取得精度については、バラつきが出る場合があります。
検証環境
- OS:Windows 2012R2(言語:日本語)
- FlexiCapture Version:12.0.3.2634
- 検証言語:中国語
手順
- FlexiCapture for Invoiceでプロジェクトを作成します。
-
必要に応じて、文書定義名を変更します。
文書定義は、基本、以下の理由から言語(国)毎に設定することを推奨します。
- 言語に依るチューニング効果が期待できること
- 他言語の影響が無く既存環境の識字率を保つことができること
- 問題発生時の切り分けがし易いこと
文書定義を言語毎に分ける場合、運用の際は、プロジェクトやバッチタイプ等で分ける利用が想定されます。
-
文書定義エディタにて、文書定義を開き、「文書定義メニュー > 文書定義プロパティ:請求書の設定 タブ」を開きます。
ここで、「国と言語」の「編集」ボタンをクリックします。
-
「国と言語」の画面で、「国:Japan」を選択「複製」ボタンをクリックします。
-
「国名を選択」画面で、「中国」を選択します。
-
「中国 設定」画面が表示されます。
「中国繁体字」を選択、「追加」ボタンをクリックします。
-
「言語キーワード」画面が表示されるので、以下の項目に対して、「追加」ボタンから値を入力します。
設定例:
見つかった要素
キーワード
備考
InvoiceNumberHighConfidenceLabels
發票號碼
AmountTotalHighConfidenceLabels
總計
AmountTotalNettoLabels
銷售額合計
AmountTotalTaxLabels
營業稅
複数項目追加
營業稅額
LineltemsDescriptionLabels
品名
LinelternsQuantityLabels
數量
LineitemsUnitPriceLabels
單價
LineltemsTotalPriceBruttoLabels
金額
上記作業が完了したら、今度は、「中国簡体字」を選択し、「追加」ボタンをクリックし、再度上記設定を反映します。
-
「中国 設定」画面で、「キーワードタブ」に移動し、見つかった要素の項目にて、不要な日本語キーワードを削除し、必要と思われる、中国の用語を反映します。
今回の検証では、以下の様な設定を行いました。
見つかった要素
キーワード
合計
TotalAmountDue
合計
銷售額合計
總計
税合計
税額
營業稅
營業稅額
IBAN
IBAN
VATID
国内VATID
銀行コード
銀行口座
-
必要に応じて、「中国 設定」画面で、「税率 タブ」、「税グループ タブ」、「通貨 タブ」等の設定・変更をして下さい。
-
設定が完了し、「国と言語」画面迄、戻ったら、「国:Japan」のチェックを外します。
すると、「言語:日本語」が自動的に、削除されます。
「国と言語」の画面、「国」のリストに、先の手順で「複製」した際の「中国」が追加されていることが確認できます。
-
データセットの設定:
文書定義プロパティ画面に戻りましたら、「データセット」タブに移動し、「vendor」の登録を行います。
補足:
- Vendorの登録は、文字コードに留意してご登録下さい。
以上で、検証する為の設定手順は完了です。文書定義を「公開」し、動作をご確認下さい。
コメント
0件のコメント
サインインしてコメントを残してください。