同じ 文書 を XLS と XLSX ファイル で FlexiLayout Studio・FlexiCaptureにインポートしたが、認識結果が違う

現象

同じ 文書 を XLS と XLSX ファイル で 保存されています。FlexiLayout Studio・FlexiCaptureに 両方ファイル を インポートしたが、認識結果が違います。

原因

原因は XLS と XLSX の PDF化 が 違うことです。

FlexiCaptureとFlexiLayout Studioは Officeファイル をインポートする時、この Officeファイル を PDFに変換します。変換に使われられる ツール は3つあります:

  • LibreOffice
  • Microsoft Office
  • FlexiCaptureと一緒にインストールされているOpenOffice

変換に使われる ツール を 画像処理設定の メニュー で選択できます。詳細はこちらです。

例えとして、OpenOfficeで PDF化 を 行う場合、XLS と XLSX の処理が違いますので、違う結果が出ることがあります。

解決

別の ツール で PDF化 を 試します。

XLSX の 処理には Microsoft Office が 最適 だと考えられるが、処理には Microsoft Office の コピー が Microsoft Officeの ライセンス で アクティブ化 されていることが必要です。

もし、Microsoft Office を 使えない場合、LibreOfficeでも 試してください。

また、PDF化の結果のPDFは PDFファイルの処理 の 設定に従って処理されます。画像上で 表示しない テキスト が ある という 現象が 発生したら、PDFファイルのテキストレイヤーを使わず、OCRのみを使用するように PDFファイルの処理 を 変更ください。

追加情報

他にご質問がございましたら、リクエストを送信してください

コメント

0件のコメント

サインインしてコメントを残してください。