文書定義エディタ > データタイプでの正規表現の使い方

質問

認識処理の際、識字率を上げる為、正規表現の使用方法を教えてください。

回答

手順は以下の通りです。

  1. 文書定義エディタ:該当フィールドのプロパティを開き、データタブを開きます。

    「データタイプ」の「編集」ボタンをクリックします。

    mceclip0.png

  2. [内容詳細-テキスト]が開かれます。今回、正規表現は、英数字のみの為、言語を「英語」に設定します。

    内容の設定を「特殊」を選択、「新規」ボタンをクリックします。

    mceclip1.png

  3. 「新規データタイプウィザード」が開かれます。「新規データタイプ基準:正規表現」のみを選択し、「次へ」ボタンをクリックします。

    mceclip2.png

  4. 正規表現欄に、以下の内容を入力、「次へ」ボタンをクリックします。

    [A-Z]{2}[0-9]{8}

    mceclip3.png

    これは、以下の様な正規表現を意味します。

    正規表現:

    • 1桁目:英大文字
    • 2桁目:英大文字
    • 3桁目:数字
    • 4桁目:数字
    • 5桁目:数字
    • 6桁目:数字
    • 7桁目:数字
    • 8桁目:数字
    • 9桁目:数字
    • 10桁目:数字

    最初の2桁が英大文字

    後の8桁が、数字。

    ご参考:正規表現の設定内容と、例。

  5. 一般設定で、本設定の名前を付け、「完了」ボタンをクリックします。

    mceclip4.png

  6. データタイプが登録、選択されていることを確認し、「OK」ボタンで終了します。

    mceclip5.png

「テスト中メニュー > テストを実行」から動作確認を実施します。

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。