ABBYY FineReader Engine 12 доступен в трех версиях:
- ABBYY FineReader Engine 12 для Windows
- ABBYY FineReader Engine 12 для Linux
- ABBYY FineReader Engine 12 для Mac
Системные требования
Компьютер
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Операционная система
Протестированные платформы облачных вычислений и виртуальные среды
- Azure App Services
- Azure Cloud Services
- Azure Service Fabric
- Azure Virtual Machines
- Amazon EC2
- Microsoft Hyper-V Server 2008
- Microsoft Hyper-V Server 2008 R2 SP1
- Microsoft Hyper-V Server 2012
- Microsoft Hyper-V Server 2012 R2
- Microsoft Hyper-V Server 2016
- Oracle VM VirtualBox 5.2
- Parallels Desktop for Mac 13.0.1
- VMware ESXi 6.5
- VMware Workstation Player 12.5
- VMware Workstation Pro 14.0.0
Протестированные среды разработки Java
Решение ABBYY FineReader Engine было протестировано на следующих наборах разработчика Java:
- для 32-битных операционных систем:
- Oracle Java SE Development Kit 8u201 i586
- Oracle Java SE Development Kit 8u202 i586
- для 64-битных операционных систем:
- OpenJDK 11.0.2 x64
- OpenJDK 12.0.2 x64
- OpenJDK 13 x64
- Oracle Java SE Development Kit 8u201 x64
- Oracle Java SE Development Kit 8u202 x64
- Oracle Java SE Development Kit 12.0.2 x64
- Oracle Java SE Development Kit 13 x64
ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.
Память
- для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ;
- для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ;
- для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ;
- для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ.
Место на жестком диске
- 1.600 МБ для установки библиотек (функционал ядра)
- Дополнительные 400 МБ для установки библиотеки модулей OfficeConverters
- 100 МБ для работы программы
- Дополнительные 15 МБ на каждую страницу при обработке многостраничного документа
Другие требования
- Полностью TWAIN-совместимый сканер, цифровая фотокамера или факс-модем – только для функции сканирования.
- Видеокарта и монитор с минимальным разрешением 1024x768 — для обучения шаблонов, редактирования словарей и сканирования при помощи графического пользовательского интерфейса).
- Microsoft Internet Explorer 8.0 или выше. Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.
ABBYY SDK 12 Licensing Service (системные требования)
Компьютер
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Операционная система
- Windows Server 2016, Windows Server 2012 R2, Windows Server 2012, Windows Server 2008 R2
- Windows 10, Windows 8.1, Windows 8, Windows 7 SP1
Протестированные платформы облачных вычислений и виртуальные среды
- Microsoft Hyper-V Server 2008
- Microsoft Hyper-V Server 2008 R2 SP1
- Microsoft Hyper-V Server 2012
- Microsoft Hyper-V Server 2012 R2
- Microsoft Hyper-V Server 2016
- Oracle VM VirtualBox 5.2
- Parallels Desktop for Mac 13.0.1
- VMware ESXi 6.5
- VMware Workstation Player 12.5
- VMware Workstation Pro 14.0.0
Поддерживаемые среды разработки
ABBYY FineReader Engine для Windows предоставляет API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, .NET, Delphi, Java, а также из любых других средах разработки с поддержкой компонент COM. Engine может быть адаптирован для использования со скриптовыми языками, например, VBS, JS, или Perl.
ABBYY FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом ABBYY.
Для использования динамической библиотеки ABBYY FineReader Engine необходимы стандартные библиотеки libstdc++.so.6, libgcc_s.so.1 и libgomp.so.1
Компьютер
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше) и с поддержкой SSE и SSE 2.
Операционная система
- Fedora 31, 30, 29
- Red Hat Enterprise Linux 8.1, 7.7, 6.10
- SUSE Linux Enterprise Server 15 SP1, 12 SP4, 11 SP4
- Debian GNU/Linux 10.2, 9.11, 8.11
- Ubuntu 19.10, 19.04, 18.04.3 LTS, 16.04.6 LTS, 14.04.6 LTS
- CentOS 8.0, 7.7, 6.10
- ALT Linux 9.0, 8.2 (no support for Wibu dongles)
- Amazon Linux AMI 2018.03
Компания ABBYY также предоставляет услугу профессиональной адаптации ПО для других платформ.
Протестированные платформы облачных вычислений и виртуальные среды
- Microsoft Azure Virtual Machines
- Amazon EC2
- Microsoft Hyper-V Server 2012 R2
- Microsoft Hyper-V Server 2016
- Oracle VM VirtualBox 5.2
- VMware ESXi 6.5
- VMware Workstation Player 12.5
- VMware Workstation Pro 14.0.0
- Linux KVM
ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.
ABBYY FineReader Engine Java wrapper был протестирован в следующих Java Development Kits:
- OpenJDK 13 x64
- OpenJDK 14 Early-Access (build 21) x64
- Oracle Java SE Development Kit 8u231 x64
- Oracle Java SE Development Kit 11.0.5 (LTS) x64
- Oracle Java SE Development Kit 13.0.1 x64
Память
- для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
- для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ
- для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ
- для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ
Место на жестком диске
2150 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
Другие требования
- Объем tmpfs: 1ГБ*(количество ядер) + 4ГБ
- Объем swap: 1ГБ*(количество ядер) + 4ГБ
- ABBYY FineReader Engine совместим с системой инициализации systemd.
- Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.
Поддерживаемые среды разработки
ABBYY FineReader Engine для Linux предоставляет нативный C/C++ API и Java-обертку для него, поэтому приложения должны быть написаны на C/C++ или Java.
Компьютер
ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
Операционная система
- macOS 10.13.x High Sierra
- macOS 10.14.x Mojave
- macOS 10.15.x Catalina
Память
- для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
- для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ
Место на жестком диске
2500 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.
Поддерживаемые среды разработки
ABBYY FineReader Engine для Mac предоставляет только нативный C/C++ API, поэтому приложения должны быть написаны на C/C++.
Языки распознавания
ABBYY FineReader Engine 12 поддерживает самое большое количество языков распознавания на рынке. С его помощью можно распознавать языки, в письменности которых используются латиница, кириллица, греческие и армянские символы, а также арабский, бирманский (техническое превью), персидский (фарси), иврит, китайский, японский, корейский, русский языки и много других. Также доступна встроенная утилита для создания пользовательских словарей и шаблонов, что позволяет улучшить распознавания необычных слов или нетипичных шрифтов.
Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в ABBYY FineReader Engine поддержано 210 OCR и 126 ICR языков.
× Со словарной поддержкой
* Арабский ICR не поддерживается. Но распознаются арабские цифры, отпечатанные вручную.
Языки сообщений
Заголовки и тексты диалогов, сообщения об ошибках и другие сообщения программы могут выводиться на английском, болгарском, чешском, китайском (КНР и Тайвань), датском, голландском, эстонском, французском, немецком, греческом, венгерском, итальянском, японском, корейском, польском, португальском (Бразилия), русском, словацком, испанском, шведском, турецком, и украинском.
Поддерживаемые форматы офисных документов*
ABBYY FineReader Engine может открывать документы нескольких форматов:
- Текстовые форматы: .doc, .docx, .rtf, .htm / .html, .txt, .odt
- Форматы таблиц: .xls, .xlsx, .ods
- Форматы презентаций: .ppt, .pptx, .odp
- Цифровые PDF: .pdf
Поддерживаемые форматы изображений
ABBYY FineReader Engine может открывать файлы изображений нескольких форматов. Кроме того, OCR SDK позволяет сохранить результаты в виде изображений нескольких форматов.
Список поддерживаемых форматов изображений:
Формат | Расширение | Поддерживает открытие | Поддерживает сохранение |
---|---|---|---|
BMP несжатый чёрно-белый 4- и 8-битный — несжатый Palette 16-битный — несжатый, несжатый Mask 24-битный — несжатый 32-битный — несжатый, несжатый Mask |
bmp | ||
BMP 4- и 8- битный — RLE сжатый Palette |
bmp | ||
DCX чёрно-белый 2-, 4- и 8- битный Palette 24- битный цветной |
dcx | ||
DjVu (только для Windows) чёрно-белый, серый, цветной |
djvu, djv | ||
GIF чёрно-белый — LZW-сжатый 2-, 3-, 4-, 5-, 6-, 7-, 8-битный Palette — LZW-сжатый |
gif | ||
JBIG2 чёрно-белый |
jb2 | ||
JPEG серый, цветной |
jpg, jpeg, jfif | ||
JPEG 2000 серый — Part 1 цветной — Part 1 |
jp2, jpc, j2k | ||
PCX чёрно-белый 2-, 4- и 8-битный Palette 24- битный цветной |
pcx | ||
Изображение PDF (скан PDF) | |||
Созданный в цифровом виде PDF (Версия 1.7 или ранее) | |||
PNG чёрно-белый, серый, цветной |
png | ||
TIFF чёрно-белый — несжатый, CCITT3, CCITT4, Packbits, ZIP, LZW серый — несжатый, Packbits, JPEG, ZIP, LZW 24-битный цветной — несжатый, JPEG, ZIP, LZW 1-, 4-, 8-битный Palette — несжатый, Packbits, ZIP, LZW (включая многостраничный TIFF) |
tif, tiff | ||
TIFF чёрно-белый — CCITT3FAX |
tif, tiff | ||
WDP (только для Windows) чёрно-белый, серый, цветной (требуется WIC или Microsoft .NET Framework 3.0) |
Wdp | ||
WIC-compatible (только для Windows) (требуется WIC или Microsoft .NET Framework 3.0) |
Примечание: ABBYY FineReader Engine не открывает изображения размером более 32512*32512 пикселей.
Форматы сохранения документов
ABBYY FineReader Engine позволяет сохранить распознанный текст в следующих форматах:
- RTF
- DOCX
- XLSX and XLS (только в версии для Windows)
FineReader Engine поддерживает форматы MS Excel 5 и 8 для сохранения резултатов в формате XLS.
- PPTX
- PDF, PDF 2.0, PDF/UA
- PDF/A-1(a,b), PDF/A-2(a,b,u), PDF/A-3(a,b,u)
FineReader Engine поддерживает MRC-компрессию для всех PDF-форматов.
- HTML, HTML 5
ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).
- TXT
ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).
- CSV
- XML — структура распознанного текста описана с помощью XML.
- ALTO 3.1
- XPS (только в версии для Windows)
- FB2
- EPUB
- ODT
- vCard — только для экспорта визитных карточек
Поддерживаемые типы штрихкодов
ABBYY FineReader Engine распознает следующие типы штрихкодов:
- Одномерные: Codabar, Code 128, Code 39, Code 93, Code 32, EAN 8 and 13, Full ASCII Code 39, GS1-128, IATA 2 of 5, Industrial 2 of 5, Interleaved 2 of 5, Intelligent Mail (a.k.a USPS 4-CB), Matrix 2 of 5, Patch, PostNet, UPC-A, UPC-E (в дополнение к приведенному списку в версии для Windows доступны следующие одномерные штрихкоды: KIX, Royal Mail 4-State (RM4SCC), Australia Post 4-State).
- Двумерные: Aztec, Data Matrix, MaxiCode, PDF 417, QR Code
Извлечение данных из MRZ-строки (машиночитаемой зоны)*
ABBYY FineReader Engine позволяет определить и извлечь данные на изображении паспортно-визовых документов из машиночитаемой зоны, выполненной в соответствии со стандартами ICAO 9303.
FineReader Engine обрабатывает информацию из машиночитаемой зоны нескольких типов:
- 2-строчная
- 3-строчная
FineReader Engine позволяет извлечь дополнительную информацию из паспортно-визовых документов:
- Количество строк в MRZ
- Все символы из каждой строки
- Дополнительные данные из каждой строки
- Тип и подтип документа
- Номер документа
- Код страны выдачи
- Дата истечения срока действия
- Фамилия, имя, отчество
- Национальность
- Дата рождения и пол
- Личный номер
С помощью ABBYY FineReader Engine можно извлечь контрольные суммы для каждого значения. Для повышения качества данных в документе в продукте используется логический тип данных, который проверяет соответствие финальной контрольной суммы индивидуальным значениям контрольных сумм.
Распознавание меток (OMR)
В ABBYY FineReader Engine поддержано распознавание одиночных меток и групп меток. При распознавании корректно обрабатываются как ошибочно выбранные метки, так и полностью закрашенные метки в самых различных вариациях:
- Символьные метки в индивидуальных квадратах.
- Квадраты на сером фоне.
- Индивидуальная посимвольная разметка (требует ручного обучения).
Дополнительную техническую информацию можно найти в файле справки ABBYY FineReader Engine.
Комментарии
0 комментариев
Войдите в службу, чтобы оставить комментарий.