現象
同じ 文書 を XLS と XLSX ファイル で 保存されています。FlexiLayout Studio・FlexiCaptureに 両方ファイル を インポートしたが、認識結果が違います。
原因
原因は XLS と XLSX の PDF化 が 違うことです。
FlexiCaptureとFlexiLayout Studioは Officeファイル をインポートする時、この Officeファイル を PDFに変換します。変換に使われられる ツール は3つあります:
- LibreOffice
- Microsoft Office
- FlexiCaptureと一緒にインストールされているOpenOffice
変換に使われる ツール を 画像処理設定の メニュー で選択できます。詳細はこちらです。
例えとして、OpenOfficeで PDF化 を 行う場合、XLS と XLSX の処理が違いますので、違う結果が出ることがあります。
解決
別の ツール で PDF化 を 試します。
XLSX の 処理には Microsoft Office が 最適 だと考えられるが、処理には Microsoft Office の コピー が Microsoft Officeの ライセンス で アクティブ化 されていることが必要です。
もし、Microsoft Office を 使えない場合、LibreOfficeでも 試してください。
また、PDF化の結果のPDFは PDFファイルの処理 の 設定に従って処理されます。画像上で 表示しない テキスト が ある という 現象が 発生したら、PDFファイルのテキストレイヤーを使わず、OCRのみを使用するように PDFファイルの処理 を 変更ください。
コメント
0件のコメント
サインインしてコメントを残してください。