オートコレクトオプション - 不要な文字の削除・置換

質問

オートコレクトオプションを用いて、不要な文字の削除・置換を設定する方法を教えてください。

回答

取得対象フィールドの文字種やパターンが決まっている場合、「データタイプ」を適切に設定する事で認識精度を向上させることが可能です。

一方、「データタイプ」を設定して認識対象文字やパターンを限定した場合、(エンジンにより)条件に合わない文字として判断されると、不明文字(Unkown Character)=「^」として出力されてしまいます。この文字は認識結果として不要であることが多く、あらかじめ削除しておきたいケースがほとんどです。

また、文字・単語間には(エンジンにより)スペースが自動挿入されますが、日本語ドキュメントの場合、文字間のスペースが(欧米の文書と比較して)大きいため、不必要なスペースが挿入されてしまいがちです。特に、対象フィールドが金額や会員番号などでスペースが不要の場合、(同様に)事前に削除しておきたいケースもあります。

このような際、「オートコレクトオプション」機能を使用して(認識結果から)不要な文字の削除を実現する事が可能です。

【オートコレクトオプションの設定方法】

「文書定義 」> フィールドの「プロパティ」>「データ」タブ >「オートコレクトオプション」の[編集]ボタンをクリックし、「オートコレクトオプション」パネルを開きます。

mceclip1.png

ここで、「文字の置換」>[編集]ボタンをクリックし、置換(削除)の設定を以下のように適切に行う事で、不要な文字の除去が可能となります。

※検証ステーションでの編集時等では動作しないよう「認識後にオートコレクトを1回のみ適用」をチェックする事が推奨です。

mceclip4.png

※「余分なスペースを削除」は主に英文用であり、単語間のスペースが2つ以上の場合、余分なスペースを削除する(1つのみ残す)機能です。

mceclip3.png

なお、「オートコレクトオプション」では、上記以外にも様々な文字置換が可能です。要件に応じて設定をご検討ください。

追加情報

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。