質問
オートコレクトオプションを用いて、不要な文字の削除・置換を設定する方法を教えてください。
回答
取得対象フィールドの文字種やパターンが決まっている場合、「データタイプ」を適切に設定する事で認識精度を向上させることが可能です。
一方、「データタイプ」を設定して認識対象文字やパターンを限定した場合、(エンジンにより)条件に合わない文字として判断されると、不明文字(Unkown Character)=「^」として出力されてしまいます。この文字は認識結果として不要であることが多く、あらかじめ削除しておきたいケースがほとんどです。
また、文字・単語間には(エンジンにより)スペースが自動挿入されますが、日本語ドキュメントの場合、文字間のスペースが(欧米の文書と比較して)大きいため、不必要なスペースが挿入されてしまいがちです。特に、対象フィールドが金額や会員番号などでスペースが不要の場合、(同様に)事前に削除しておきたいケースもあります。
このような際、「オートコレクトオプション」機能を使用して(認識結果から)不要な文字の削除を実現する事が可能です。
【オートコレクトオプションの設定方法】
「文書定義 」> フィールドの「プロパティ」>「データ」タブ >「オートコレクトオプション」の[編集]ボタンをクリックし、「オートコレクトオプション」パネルを開きます。
ここで、「文字の置換」>[編集]ボタンをクリックし、置換(削除)の設定を以下のように適切に行う事で、不要な文字の除去が可能となります。
※検証ステーションでの編集時等では動作しないよう「認識後にオートコレクトを1回のみ適用」をチェックする事が推奨です。
※「余分なスペースを削除」は主に英文用であり、単語間のスペースが2つ以上の場合、余分なスペースを削除する(1つのみ残す)機能です。
なお、「オートコレクトオプション」では、上記以外にも様々な文字置換が可能です。要件に応じて設定をご検討ください。
コメント
0件のコメント
サインインしてコメントを残してください。