画像解像度:OCRを行う場合の最適な設定

ABBYY OCRテクノロジーを使用する場合に適した画像解像度

  • フォントサイズが8〜10ポイントの通常のテキストをスキャンする場合、OCRには300dpiの解像度を使用することをお勧めします。 ABBYYテクノロジーは、そちらの解像度に合わせて調整されています。
  • フォントテキストサイズが小さい(8ポイント以下)場合は、400〜600dpiの解像度を使用することをお勧めします。
  • スキャンの解像度が低い、例えば200dpiの場合は、10ポイントのフォントサイズは小さすぎて高品質のOCR結果が得られません。欠落のピクセルを補正するために、画像は内部で拡大されます(最大400dpi)。低解像度が原因で画質が低下すると、OCRの精度が低下する可能性があります。 文字画像の不確実性がより多くの認識バリアントを生成するため(処理に時間がかかるため)、速度の低下を引き起こす可能性もあります。

ピクセルの文字サイズに関するOCRテクノロジーの推奨事項と制限事項

  • 1バイトの単純なスクリプト(英語、ロシア語などの言語)
    推奨:20
    最小:12
  • 2バイトの複雑なスクリプト(日本語、中国語などの言語)
    推奨:25
    最小:22
    最大:60(本文に適用;見出しの場合は制限がありません)
  • 1バイトの複雑なスクリプト(タイ語、ヘブライ語、アラビア語など言語)
    推奨:20
    最小:12

ページレイアウト分析には、テキスト文字列の小さい文字サイズを1ミリメートル以上が必要です。

カラー・グレー・白黒の画像の推奨事項

  • ABBYYテクノロジーは画像上の領域とオブジェクトを検出するために色情報を使用します。
  • 複雑なレイアウトを処理する必要がある場合は、カラー、またはグレースケールの画像を使用することをお勧めします。

光学式文字認識は、常に白黒のみを含むモノクロ画像で実行されます。そのため、最適なOCR結果を得るには、画質のいい、適切なバイナリイメージを生成することが重要です。最高の認識品質を実現するために、ABBYYテクノロジーでは「単純な」2値化だけでなく、独自の適応型2値化テクノロジーが使用されています。

OCRでサポートされている最大のフォントサイズ

  • ABBYY OCRの対応される最大のフォントサイズは140ptです。

ピクセルの最大画像サイズ

  • ABBYY製品は、最大32512 * 32512ピクセルの画像サイズを処理できます。
  • これ以上大きい画像の場合は、カットし、セグメントを個別に処理する必要があります。

画像ファイルの最大サイズ

  • ABBYY Technology v.8.x以前では、最大2GBの画像ファイルを処理できました。
  • 現在、V9.0以降、こちらの制限はなくなりました。

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。