Системы оптического распознавания текста в Linux — обзор и сравнительное тестирование

Содержание

1. Особенности программы CuneiForm, возможности

2014-03-09 13_16_56-CuneiformCuneiForm

Скачать можно с сайта разработчика: https://launchpad.net/cuneiform-linux

Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!

Плюсы:

— распознавание текста на 20 самых популярных языках мира (английский и русский само собой входит в это число);

— огромная поддержка различных печатных шрифтов;

— проверка по словарю распознанного текста;

— возможность сохранения результаты работы в нескольких вариантах;

— сохранение структуры документа;

— отличная поддержка и распознавание таблиц.

Минусы:

— не поддерживает слишком большие документы и файлы (более 400 dpi);

— не поддерживает на прямую некоторые типы сканеров (ну это не страшно, в комплект к драйверам сканера идет и спец. программа для сканирования);

— дизайн не блещет (но кому он нужен, если программа в полной мере решит задачу).

Аналоги Adobe Photoshop: GIMP и Photoscape

Фотошоп уже давно стал не просто программой, а словом нарицательным. Ведь мы очень часто слышим, что фотографию «отфотошопили», хотя для ретуши могли применять вообще другую программу. Впрочем, Photoshop — это действительно мощный и удобный профессиональный инструмент для обработки фотографий и создания графики. Однако, компания Adobe хочет за него довольно большую сумму ежемесячно. Если вы зарабатываете с помощью этой программы и уже умеете с ней работать, то проще, конечно, платить.

А вот если вам лишь иногда нужно поправить пару изображений или вы только начинаете свой путь дизайнера или фотографа, то стоит присмотреться к другим решениям. Например, GIMP — давний конкурент Photoshop, известный среди любителей бесплатного софта, ведь он распространяется по лицензии GNU.

Приложение существует для Windows, Mac и Linux, так что вы везде сможете им воспользоваться. Конечно, набор функций здесь поменьше, чем в продукте Adobe, но для основных задач GIMP хватит с лихвой. Обрезать фотографию, исправить дефекты на фото, убрать эффект красных глаз — всё это под силу данной программе. Есть тут и работа со слоями, а также возможность создавать web-макеты. В общем, бесплатный аналог мало в чём уступает оригиналу.

Ещё один неплохой аналог — это программа Photoscape. Она немного попроще GIMP, но с основными задачами справляется. Тут тоже есть работа со слоями, ретушь, изменение размера, кобминирование эффектов и многое другое, благодаря чему обработать фотографию с помощью этого инструмента не составит труда. Скачать с официального сайта можно версию для Windows, а вот для Mac приложение доступно в Mac App Store. Версии для Linux у Photoscape нет.

FineReader Engine 11 for Linux спецификация

Avatar

Системные требования

ABBYY FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом ABBYY.

Для использования динамической библиотеки ABBYY FineReader Engine необходимы стандартные библиотеки libstdc++.so.6 и libgcc_s.so.1.

Работоспособность ABBYY FineReader Engine проверялась на следующих операционных системах:

  • Fedora 25, 24, 23
  • Red Hat Enterprise Linux 7.2, 6.8
  • openSUSE 42.1
  • SUSE Linux Enterprise Server 12 SP1, 11 SP1
  • Debian GNU/Linux 8.7, 8.0
  • Ubuntu 16.04.1 LTS, 15.10, 14.04.5 LTS, 12.04.5 LTS
  • CentOS 7.1

ABBYY FineReader Engine был протестирован в следующих платформах облачных вычислений:

  • Windows Azure
  • Amazon EC2

ABBYY FineReader Engine был протестирован в следующих виртуальных средах:

  • Microsoft Hyper-V (only with software protection key)
  • Oracle VM VirtualBox 3, 4 (Windows hosts only)
  • VMware Server 2 (Windows hosts only)
  • VMware ESXi 5
  • Linux KVM/QEMU 2.0.0

Компания ABBYY также предоставляет услугу профессиональной адаптации ПО для других платформ.

ПК Intel® Pentium® или совместимый (с тактовой частотой 1 ГГц или выше) с поддержкой SSE и SSE 2.

Оперативная память:

  • минимум 400 Мб (рекомендовано 1 Гб) для обработки одностраничных документов,
  • минимум 1Гб Мб (рекомендовано 1,5 Гб) для обработки многостраничных документов.

Свободное место на диске: 800 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Языки распознавания

Ниже представлен список поддерживаемых языков распознавания в ABBYY FineReader Engine. Доступность этих языков распознавания зависит от наличия соответствующих модулей в файлах  ABBYY FineReader Engine.

OCR:

ABBYY FineReader Engine 11 распознает документы на 202 языках, включая:

  • 47 основных языков с Латинскими, Кириллическими, Греческими или Армянскими символами, для которых FineReader Engine предоставляет словарную поддержку: Армянский (Западный, Восточный, Грабар), Башкирский, Болгарский, Каталанский, Хорватский, Чешский, Датский, Нидерландский (Нидерланды и Бельгия), Английский, Эстонский, Финский, Французский, Немецкий (новая и старая орфография), Греческий, Венгерский, Итальянский, Индонезийский, Латвийский, Литовский, Норвежский (Нюнорск и Букмол), Польский, Португальский (Португалия и Бразилияl), Румынский, Русский, Словацкий, Словенский, Испанский, Шведский, Татарский, Турецкий и Украинский.
  • Японский и Корейский со словарной поддержкой.
  • Тайский язык со словарной поддержкой.
  • Иврит и Идиш со словарной поддержкой.
  • Арабский со словарной поддержкой.
  • Латинский, Азербайджанский (латиница), Русский (старая орфография) со словарной поддержкой
  • 6 FineReader XIX языки со словарной поддержкой, для распознавания старых европейских документов 17-19 веков: Английский, Французский, Немецкий, Итальянский, Славянский и Испанский языки.
  • 134 дополнительных языков с Латинскими, Кириллическими и Греческими символами: Абхазский, Аварский,Агульский, Адыгейский,Азербайджанский (Кириллица), Азербайджанский (Латиница), Аймара, Албанский, Алтайский, Африкаанс,Баскский, Белорусский, Бемба, Блэкфут, Бретонский, Буготу, Бурятский,Волоф, Гавайский, Гагаузский, Галисийский, Ганда, Гуарани, Гэльский (Шотландия), Дакота, Даргинский, Дунганский,Зулу. Ингушский, Ирландский, Исландский, Кабардинский, Казахский, Калмыцкий, Каракалпакский, Карачаево-Балкарский, Кашубский, Кечуа, Кикуйю, Киргизский, Конго, Корсиканский, Корякский, Коса, Кпелле, Кроу, Крымскотатарский, Кумыкский, Курдский, Лакский, Латинский, Лезгинский, Луба, Лужицкий, Майя, Македонский, Малагасийский, Малайский, Малинке, Мальтийский, Мансийский, Маори, Марийский, Минангкабау, Могавк, Молдавский, Монгольский, Мордовский,  Мяо, Науатль, Немецкий (Люксембург), Ненецкий, Нивхский, Ногайский, Ньянджа, Оджибве, Окситанский (Провансальский), Осетинский, Папьяменто, Ретороманский, Руанда, Рунди, Саамский, Самоа, Сапотек, Свази,  Себуанский, Селькупский, Сербский (Кириллица, Латиница), Сомали, Суахили, Сунданский, Суто, Табасаранский, Тагальский, Таджикский, Таити, Ток-Писин, Тонга, Тсвана, Тувинский, Туркменский (Кириллица, Латиница), Удмурский, Узбекский (Кириллица, Латиница), Уйгурский (Кириллица, Латиница), Уэльский, Фарерский, Фиджи, Фризский, Фриульский, Хакасский, Хани, Хантыйский, Хауса, Цзингпо, Цыганский, Чаморро, Чеченский, Чувашский, Чукотский, Шона, Эвенкийский, Эвенский, Эскимосский (Кириллица), Эскимосский (Латиница), Якутский
  • Китайский традиционный и упрощенный.
  • 4 искусственных языка: Эсперанто, Интерлингва, Идо и Окциденталь.
  • 6 языков программирования: Basic, C/C++, COBOL, Fortran, JAVA и Pascal.
  • Простые химические формулы.
  • Цифры.
  • Инструменты для создания языков, определяемых пользователями.

Поддерживаемые форматы изображений:

  • PDF: файлы формата PDF (версия 1.7 или более ранние)
  • BMP:
    • 2-битный – несжатый черно-белый
    • 4- и 8- битный – несжатый Palette
    • 16- битный – несжатый Mask
    • 24- битный – несжатый Palette and TrueColor
    • 32- битный – несжатый Mask
  • PCX, DCX:
    • 2- битный – черно-белый
    • 4- и 8- битный – градации серого
    • TrueColor
  • JPEG: серый, цветной
  • JPEG 2000, part1: серый, цветной
  • PNG: чёрно-белый, серый, цветной
  • TIFF: чёрно-белый, серый, цветной, многостраничный. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 3 FAX (2D), CCITT Group 4, PackBits, JPEG, ZIP
  • GIF (только открытие): чёрно-белый, серый, цветной
  • DjVu (только открытие): чёрно-белый, серый, цветной
  • JBIG2: черно-белый
  • WDP, WIC-совместимый (только открытие): чёрно-белый, серый, цветной

Внимание: ABBYY FineReader Engine поддерживает открытие изображений с разрешением не более 32512*32512 пикселей.

Форматы сохранения документов:

  • Rich Text Format (.RTF)
  • Microsoft Word XML (.XML) (только для Microsoft Office Word 2003)
  • XML-форматы Microsift Office 2007 (.DOCX, .XLSX, .PPTX)
  • PDF, PDF/A (включая компрессию)
  • Обычный текст (.TXT). ABBYY FineReader Engine 11 для Linux поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).
  • HTML. ABBYY FineReader Engine 11 для Linux поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-8)
  • Формат с разделением запятыми (.CSV)
  • XML – структура распознанного текста описана с помощью XML
  • ODT
  • ALTO
  • FB2
  • EPUB
  • vCard

Поддерживаемые типы штрихкодов

  • Одномерные: Codabar, Code 128, Code 39, Code 93, Code 32, Full ASCII Code 39, EAN 8 и 13, IATA 2 of 5, Industrial 2 of 5, Interleaved 2 of 5, Matrix 2 of 5, Patch, PostNet, UCC-128, UPC-A, UPC-E.
  • Двумерные: PDF 417, Aztec, Data Matrix, QR Code, Maxicode

Еще есть вопросы? Отправить запрос

Недавно просмотренные статьи

Finereader 7 Pro под Wine (Установка (пока что))

Вопросы настройки, запуск любых Windows-программ, кроме игр

Модератор: Модераторы разделов

Аватара пользователя

Олександр Сообщения: 82 ОС: Mandriva 2008 Free

Finereader 7 Pro под Wine

Сообщение Олександр » 21.05.2007 04:35

Пытался установить FineFeaderrr 7 Pro под Wine 0.9.20…. Во время установки мне выдает

Код: Выделить всё

err:msi:msi_dialog_oncommand button click from nowhere 0x218890 1 (nil)

Что делать? Есть люди, которые уже ставили это?

Beer Drinker

Аватара пользователя

Oleg_G Сообщения: 179 ОС: Mandriva 2009.0 Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение Oleg_G » 21.05.2007 10:10

Под wine@etersoft заводится полпинка. Только один глюк (что под цшту что под кросовер 5) — при старте пропадают панельки сканирования, форматирования, приходится их в ручную выставлять.

ЗЫ Под обычным вайном инсталятор будет требовать установленного ie (покрайней мере ФР6 требовал)

Винды ёкхэрэ! Чохча кульгэ тыр Линух!

Аватара пользователя

estarchak Сообщения: 1368 Статус: Оракловод

Re: Finereader 7 Pro под Wine

Сообщение estarchak » 22.05.2007 22:53

cherep36 писал(а): ↑

22.05.2007 21:46

Олександр

, А не судьба пользоваться

родным

??

The ABBYY FineReader Engine 6.0 for Linux is a Software Development Kit (SDK) for integrating ABBYY recognition technologies into Linux applications.

Родного нету. А движок денег стоит.

Дети любят тигра больше, чем Пржевальский лошадей. © Тимур Шаов.

Топик не читал, но внимательно просмотрел.

Аватара пользователя

Oleg_G Сообщения: 179 ОС: Mandriva 2009.0 Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение Oleg_G » 22.05.2007 23:41

cherep36 писал(а): ↑

22.05.2007 21:46

А не судьба пользоваться родным??

Под linux нормальной распознавалки нет, а для русского йазыка и не будет видимо.

Винды ёкхэрэ! Чохча кульгэ тыр Линух!

Аватара пользователя

magus Сообщения: 373 ОС: arch, suse, solaris

Re: Finereader 7 Pro под Wine

Сообщение magus » 07.08.2007 21:37

господа а как вы 8-й ставите? у меня почему-то сначала при запуске setup.exe попросил модуль работы с web, скачал его, потом тишина… запускаю ещё раз, опять тишина… msi файл не знаю как установить. мож какой софт нужен дополнительный? 6-й встал нормально, запустился, распознал, но второй раз запускаться не захотел. wine@etersoft 1.0.7, OS — ubuntu 7.

Аватара пользователя

Atragor Сообщения: 681 Статус:Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение Atragor » 07.08.2007 23:22

А в выводе ничего интересного нет? У меня восьмой FR на wine-0.9.42 встал нормально (тоже правда скачал модуль gecko), вроде работает. И кстати откуда там MSI?

If you were MEANT to understand it, we wouldn’t have called it ‘code’ © bash.org

Аватара пользователя

magus Сообщения: 373 ОС: arch, suse, solaris

Re: Finereader 7 Pro под Wine

Сообщение magus » 08.08.2007 00:56

сначала файлик разорхивируется в c:tempbla-bla-bla… потом тихо… захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится…. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))

тока что попробовал в федоре, та же хрень…. может диск другой установочный поискать ))

$tydent Сообщения: 56 ОС: Ubuntu 8 i686, венда ХР Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение $tydent » 26.11.2007 01:22

magus писал(а): ↑

08.08.2007 00:56

сначала файлик разорхивируется в c:tempbla-bla-bla… потом тихо… захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится…. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))

тока что попробовал в федоре, та же хрень…. может диск другой установочный поискать ))

такая ж хрень — (

Пробовал скопировать с винды установленный FR8 — нормально запускается. но при попытке добавления изображения для сканирования ругается на неправильные пути ((((((

$tydent Сообщения: 56 ОС: Ubuntu 8 i686, венда ХР Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение $tydent » 26.11.2007 01:33

$tydent писал(а): ↑

26.11.2007 01:22

magus писал(а): ↑

08.08.2007 00:56

сначала файлик разорхивируется в c:tempbla-bla-bla… потом тихо… захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится…. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))

тока что попробовал в федоре, та же хрень…. может диск другой установочный поискать ))

такая ж хрень — (

Пробовал скопировать с винды установленный FR8 — нормально запускается. но при попытке добавления изображения для сканирования ругается на неправильные пути ((((((

Разобрался — скопировал с винды вайн — и в winecfg — прописл к нему путь — и заработало ))))))

gabix Сообщения: 315 ОС: openSUSE Leap 15.1

Re: Finereader 7 Pro под Wine

Сообщение gabix » 22.12.2007 12:53

Не могут поставить FineReader 8.0 Professional / wine 0.9.51 / Mandriva Linux 2008: запускаю setup.exe, доходит до окна ввода инициалов, организации и серийного номер, ввожу, но дальше установка не идёт. Попытался поискать фразу «FineReader wine Linux установка ввод серийный номер», но почему-то только всякие порносайты и прочий мусор находится.

Hoblin Модератор Сообщения: 1442 Статус: Etersoft team ОС: ALT Linux

Re: Finereader 7 Pro под Wine

Сообщение Hoblin » 24.12.2007 10:56

gabix писал(а): ↑

22.12.2007 12:53

Не могут поставить FineReader 8.0 Professional / wine 0.9.51 / Mandriva Linux 2008: запускаю setup.exe, доходит до окна ввода инициалов, организации и серийного номер, ввожу, но дальше установка не идёт. Попытался поискать фразу «FineReader wine Linux установка ввод серийный номер», но почему-то только всякие порносайты и прочий мусор находится.

Можно посмотреть, например,

на AppDB

. Информация точно актуальна и для свободной сборки WINE@Etersoft. В стандартном wine давно не пробовал, не буду утверждать, что работает. Обратите внимание на коммент с ручным созданием директорий.

Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 29.12.2007 20:57

чета я не понял .. неужели на самом деле файнридер работате у когото нормально? у меня так установитьс вроде установился а вот фалы с картинками открывать не желает

:(

и как им тогда пользоватьсяя то.

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

Аватара пользователя

ЭЖД Сообщения: 332 Статус: openSuSE Member ОС: openSuSE

Re: Finereader 7 Pro под Wine

Сообщение ЭЖД » 29.12.2007 23:36

FineReader 8.0 Professional / wine 0.9.51 / OpenSuSE 10.3
ставится и работает нормально. а то что вылетает, если много картинок ему скормить, то это он и в винде вылитает %)

«Когда истинный гений появляется в этом низком мире, его можно узнать по тому знаку, что все глупцы объединяются против него»

Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 30.12.2007 01:41

ЭЖД писал(а): ↑

29.12.2007 23:36

FineReader 8.0 Professional / wine 0.9.51 / OpenSuSE 10.3

ставится и работает нормально. а то что вылетает, если много картинок ему скормить, то это он и в винде вылитает %)

ну не из-за одной же картики виснуть сразу же после того как запустился.

Неставиться вобчем у меня ни какой файнридер

:(

уже перепробывал и пятый, четвертый и шестой и седьмой и триальные версии и нифика, одно и тоже виснет сразу после запуска если попытаться открыть картинку

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 01.01.2008 04:20

Если кому интересно

:)

Заметил что файнридер (любая версия) запущеный в wine зависает намертво если пытаться открыть изображение с разрешением больше 300dpi

:)

а так работает вполне удовлетворительно (для моих запросов)

Вот бы еще интерфейс программы сделать на русском языке ну или хотя бы на английском. а то тыркаться в французких надписях чета напрягает немного

:)

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

ozone baby Сообщения: 221 ОС: Ubuntu i386/Ubuntu amd64

Re: Finereader 7 Pro под Wine

Сообщение ozone baby » 05.01.2008 19:12

Не работает почему-то FineReader 8 под Wine 0.9.52. Работал нормально под последней сборкой Etersoft — но она основана на wine 0.9.46 или 47. Установил свежий wine, русифицировал, но finereader не запускается.

Аватара пользователя

Redfoxnet Сообщения: 394 ОС: Gentoo Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение Redfoxnet » 05.01.2008 20:11

ozone baby писал(а): ↑

05.01.2008 19:12

Не работает почему-то FineReader 8 под Wine 0.9.52. Работал нормально под последней сборкой Etersoft — но она основана на wine 0.9.46 или 47. Установил свежий wine, русифицировал, но finereader не запускается.

Последняя сборка от Etersoft — на основе >=0.9.50

Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 05.01.2008 22:50

ozone baby писал(а): ↑

05.01.2008 19:12

Не работает почему-то FineReader 8 под Wine 0.9.52. Работал нормально под последней сборкой Etersoft — но она основана на wine 0.9.46 или 47. Установил свежий wine, русифицировал, но finereader не запускается.

Это скорее всего потому что вы установили новый вайн и в реестре вайновском не прописаны ключи для файнридера (ну как бывает при переустановке оконцев нужно заново устанавливать весь софт почти).

Или вы и файнридер тоже установили в новой версии wine?

P.S. Кстати вот меня интерисует вопрос, а файнридеры лицензионные чтоль пытаетесь ставить или демоверсии? лично я уже отказался от файнридера ваще.

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 06.01.2008 17:20

ozone baby писал(а): ↑

06.01.2008 02:22

етественно я заново все ставил и вообще на другом компьютере. Вайн с нуля и Файнридер с нуля. Да, последний wine@etersoft оказывается на 0.9.50 основан, но все-равно, надо свежак)

седьмой и шестой файнридер у меня нормально на wine 0.9.4 работали, четвертый не хотел ставиться, на счет восьмого незнаю честно

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

yaleks Сообщения: 2121 Статус: вне статуса ОС: Gentoo ~
Аватара пользователя

stdds Сообщения: 886 ОС: Mandriva 2008 / 2007 Free

Re: Finereader 7 Pro под Wine

Сообщение stdds » 06.01.2008 19:58

интересно когда оно так будет?

то что уже есть бесплатная прога для распознования текста хорошо, пользуюсь Cuneiform

«Нету смысла искать смысл там где нет ни какого смысла это бесмыслица ее все равно не осмыслить!» Burhan Haldun (Бесмысленые высказывания)

Аватара пользователя

Flammpanzer Сообщения: 16 ОС: Debian Lenny amd64 Контактная информация:

Re: Finereader 7 Pro под Wine

Сообщение Flammpanzer » 09.01.2008 17:52

я восьмёрку установил нормально, распознавание тоже проходило успешно, но потом прочесть сие под линухом я так и не смог, какие-то совершенно левые буквы показывает, хотя я кодировки переключал даже, как в файнридере, так и в просмотровщике под линух. Указывал разные форматы — doc, html , txt — всё бестолку. а руками перепечатывать djvu-шную книжку зае..мучаешься.

Методика тестирования

Для более объективной оценки возможностей пакетов оптического распознавания я подготовил три образца. Первый из них представляет собой страницу текста из книги «Война и мир». Данная страница из электронной книги в формате PDF была импортирована в GIMP с разрешением 300 dpi и сохранена в формате png. Таким образом, она представляет собой практически идеальный объект для распознавания и все программы должны с этим справиться без труда.
Второй образец представляет собой ту же страницу, но импортированную уже с разрешением 200 dpi и сохраненную в формате jpg с уровнем качества 60%. Любопытно посмотреть, как это скажется на качестве распознавания.
Для третьего образца та же самая страница была импортирована с разрешением уже 150 dpi. После импортирования на рисунок в GIMP был наложен фильтр «Фотокопия», имитирующий копировальную машину, что еще больше усложняет распознавание.
Что касается полученных результатов, они приведены в таблице. Показателем точности распознавания является отношение количества правильно распознанных слов к общему количеству слов в документе, выраженное в процентах и определяемое с помощью утилиты dwdiff.
Желающие могут скачать образцы и проверить результаты самостоятельно:
Образец 1, Образец 2, Образец 3.
Само собой, автор не претендует на какую-либо стопроцентную достоверность полученных результатов. При использовании других образцов результаты могут значительно измениться.
А теперь рассмотрим наших кандидатов.

Аналоги Microsoft Office: Libre Office и Open Office

Несомненно, офисные приложения Microsoft являются самыми популярными. Word, Excel, PowerPoint… Неужели и для этих программ есть замена? Разумеется, аналоги есть и для офисного ПО. Вообще аналогов очень много, но мы остановимся на двух самых крупных. Один из офисных пакетов — это Open Office. Набор приложений в нём ничем не уступает программам Microsoft. Тут тоже есть текстовый редактор, софт для таблиц, презентаций, программы для работы с изображениями, базами данных, а также редактор математических формул.

Интерфейс, разумеется, отличается от привычного MS Office, но он интуитивный, так что разобраться с тем, как пользоваться приложениями, не составит труда. Впрочем, многие меню и кнопки расположены на тех же местах, что и в софте Microsoft, благодаря чему адаптация к Open Office проходит очень быстро. Надо будет лишь привыкнуть, что вместо Word здесь Writer, Excel заменяет Calc, ну а PowerPoint — Impress. Последние версии OO позволяют открывать различные форматы, в том числе и стандартные для Microsoft Office, так что проблем при миграции не возникнет.

Open Office доступен для Linux, Windows и OS X, скачать приложения можно на официальной странице. Кроме того, OO энтузиасты портировали и на Android, благо что исходный код у программы открыт.

  Ещё один неплохой вариант для замены MS Office — это LibreOffice от The Document Foundation. Данный пакет обладает такими же возможностями, что и Open Office, но выглядит чуть-чуть проще. Но программы мощные и способны полностью заменить проприетарные приложения. Кстати, периодически высказываются идеи, что если Open и Libre Office объединят усилия, то они смогут серьёзно потеснить Microsoft на рынке офисных приложений.

CuneiForm — Цифровое перо и рукописный ввод информации

Cuneiform что это за программа?
[править]Материал из Википедии — свободной энциклопедии

CuneiForm (англ. Клинопись) — свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies.

Первоначально система CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт. CuneiForm поставлялся с некоторыми моделями сканеров. Однако после нескольких лет перерыва разработки Cognitive Technologies освободила проект, прекратив его продажу и поддержку.

[править]Особенности

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.

CuneiForm — Шрифтонезависимая система.

[править]История развития

В 1993 году Cognitive Technologies заключила OEM-контракт с канадской корпорацией Corel Corporation, по которому библиотека распознавания Cognitive встроена в популярный издательский пакет Corel Draw 3.0 (и последующие версии).

В 1996 году выпущена версия OCR CuneiForm ’96, в которой впервые в мире применены алгоритмы адаптивного распознавания.

Адаптивное распознавание — метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, то есть используется динамическая настройка (адаптация) на конкретные входные символы. Таким образом, метод совмещает универсальность и технологичность бесшрифтового подхода и высокую точность распознавания шрифтового, что позволяет кардинальным образом повысить качество распознавания.

В 1997 году в системе CuneiForm впервые применены технологии, основанные на нейронных сетях. Алгоритмы, использующие нейронные сети для распознавания символов, строятся следующим образом. Поступающее на распознавание изображение символа (растр) приводится к некоторому стандартному размеру (нормализуется). Значения яркости в узлах нормализованного растра используются в качестве входных параметров нейронной сети. Число выходных параметров нейронной сети равняется числу распознаваемых символов. Результатом распознавания является символ, которому соответствует наибольшее из значений выходного вектора нейронной сети.

В 1999 году разработан механизм воссоздания формы исходного документа «What you scan is what you get». Он позволяет придать документу его исходную форму, добиваясь того, чтобы каждый фрагмент находился на нужном месте. Особенно это касается документов со сложной топологией: многоколончатые тексты с заголовками, аннотациями, графическими иллюстрациями, таблицами, и т. д.

[править]История и перспективы развития освобожденной версии

12 декабря 2007 года была выпущена freeware-версия OCR CuneiForm и анонсировано открытие её исходных текстов.[1]

2 апреля 2008 года были опубликованы исходные тексты OCR Cuneiform под лицензией BSD[2], а осенью — исходные тексты интерфейса системы[3].

Последняя версия OpenSource версии для Windows не обновлялась с 14.02.2009.

В 2009 году выпущены графические интерфейсы к открытой версии Cuneiform на основе библиотеки Qt 4 — Cuneiform-Qt[4], YAGF[5]. Начиная с версии 0.9.0 [6] открытую версию для Linux можно использовать в качестве библиотеки.

[править]Критика

  • Программа не умеет распознавать JPEG файлы, содержащие шум (напр., скриншоты экрана), с чем лучше справляется FineReader[7].
  • Версия для Windows не обновлялась уже больше 2 лет и проект по развитию OpenOCR скорее всего заморожен в связи с отсутствием людских и денежных ресурсов[8].
  • Отсутствие встроенной поддержки распознавания документов PDF и экспорта результатов распознавания в этот формат [8].
  • Отсутствие возможности использования OpenOffice для просмотра распознанного текста (только MS Office) [9].
  • Отсутствие возможности создания табличных блоков [10]
  • Отсутствие коммерческой поддержки продукта. Официальная поддержка фирмой Cognitive Technologies по нему не оказывается.
  • Форум проекта периодически подвергается спамерским атакам, плохое модерирования на форуме (нет реакции на сигнал модератору, спамерские сообщения не чистятся, в том числе и в тематических ветках, что затрудняет их чтение) — см. вышестоящие ссылки.

[править]См. также

  • Оптическое распознавание символов
  • FineReader

[править]Ссылки

Источник: https://www.sites.google.com/site/atary66pen/cuneiform

ABBYY Fine Reader Online

Для полноты картины необходимо рассмотреть еще один продукт от ABBYY — онлайновый сервис ABBYY Fine Reader Online. Ранее он позволял после несложной регистрации распознавать бесплатно до 10 страниц в день, теперь же бесплатно можно распознать только три страницы сразу после регистрации, после чего необходимо платить. Минимальный пакет стоит 3$ за 20 страниц. Сервис поддерживает большое количество языков и форматов файлов.

2. Пример распознавания текста

Будем считать что необходимые картинки для распознавания вы уже получили (отсканировали там, или скачали в интернете книгу в формате pdf/djvu и достали из них нужные картинки. Как это сделать — см. в этой статье).

1) Открываем требуемую картинку в программе CuineForm (файл/открыть или «Cntrl+O«).

2014-03-09 16_04_59-Cuneiform

2) Чтобы  приступить к распознаванию — нужно сначала выделить различные области: текста, картинок, таблиц и пр. В программе Cuneiform это можно сделать не только в ручную, но и автоматически! Для этого щелкните по кнопке «разметка» в верхней панели окна.

2014-03-09 15_57_34-Cuneiform - [Изображение _ p0089]

3) Спустя 10-15 сек. программа автоматически подсветит все области различными цветами. Например, область текста выделяется синим цветом. Кстати, подсветила она все области правильно и довольно быстро. Честно говоря, не ожидал от нее такой быстрой и правильной реакции…

2014-03-09 15_57_54-Cuneiform - [Изображение _ p0089]

4) Для тех, кто не доверяет автоматической разметке, можно воспользоваться и ручной. Для этого есть панелька инструментов (см. картинку ниже), благодаря которой можно выделить: текст, таблицу, картинку. Передвинуть, увеличить/уменьшить начальное изображение, подрезать края. В общем, неплохой набор.

2014-03-09 15_58_11-Cuneiform - [Изображение _ p0089]

5) После того, как все области были размечены, можно приступить к распознаванию. Для этого просто щелкните по одноименной кнопке, как на картинке ниже.

2014-03-09 15_58_03-Cuneiform - [Изображение _ p0089]

6) Буквально через 10-20 сек. перед вами откроется документ в Microsoft Word с распознанным текстом. Что интересно, в тексте для этого примера, ошибки, конечно были, но их крайне не много! Тем более, учитывая в каком невзрачном качестве был исходный материал — картинка.

По скорости и качеству вполне сравнимо с FineReader!

2014-03-09 16_02_01-p0089.rtf (Последнее сохранение пользователем) [Режим ограниченной функционально

Аналоги ABBYY FineReader: SimpleOCR и CuneiForm

FineReader — это удобная программа для распознавания текста, но стоит она около 3 тысяч рублей. Конечно, можно воспользоваться пробной версией, но в ней есть ограничение на работу с 50 документами, а затем потребуется оплата. Впрочем, есть у софта ABBYY и конкурентноспособные аналоги. Например, приложение CuneiForm. Эта программа умеет распознавать все популярные шрифты, сохранять структуру документа и может работать со множеством языков, в том числе и с русским.

Программа SimpleOCR сильна в работе с рукописным текстом, CueiForm так не умеет. Зато данное ПО с русским языком не знакомо, только английский, французский и голландский. Так что, тут уже зависит от потребностей. Если нужна поддержка языков, то CuneiForm, а если распознавание рукописного текста, то SimpleOCR.

GOCR

GOCR — это свободная кроссплатформенная система оптического распознавания текстов, работающая из командной строки. Программа пока находится в ранней стадии разработки, поэтому имеет ряд серьезных недостатков (например, распознает только одноколоночный текст). Кроме того, изучение man-страницы показало, что опций, позволяющих задать язык распознавания, программа не имеет, что подтвердилось экспериментом — русский текст gocr пытается распознать как английский. Естественно, в таблицу я данную программу включать не стал.

Cuneiform что это за программа? — О компьютерах просто

Cuneiform что это за программа?

OCR CuneiForm сможет отсканировать и мгновенно распознать бумажную документацию по технологии Optical Character Recognition в редактируемые текстовые и табличные форматы, совместимые с Microsoft Office Word и Excel.

Потом материалы лучше сохранить и редактировать в офисных пакетах, текстовых и табличных редакторах, аналогах Microsoft Word и Microsoft Excel.

Программа распространяется «как есть», разработчики не несут ответственности в связи с возможными проблемами и могут отменить действие свободной лицензии для следующих версий, поэтому стоит поторопиться и последнюю версию OCR CuneiForm скачать бесплатно для Windows 10, 8.

1, 8, 7, Vista, XP, Linux или Mac OS X. Экономить время с КьюниФорм разработчики предлагают по принципу: чем лучше отсканировать и распознать, тем быстрее исправить и получить готовый результат.

Распознавание текста. Бесплатная программа — аналог FineReader

Рано или поздно, все кто часто работает с офисными программами,  сталкиваются с типичной задачей — отсканировать текст с книги, журнала, газеты, просто листочков, а затем перевести эти картинки в текстовый формат, например, в документ Word.

Чтобы это сделать необходим сканер и специальная программа для распознавания текста. В этой статье пойдет речь о бесплатном аналоге FineReader — CuneiForm (о распознавании в FineReader — см. в этой статье).

Начнем…

CuneiForm

Скачать можно с сайта разработчика: http://cognitiveforms.com/

Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!

Источник: https://ruspchelper.com/cuneiform-chto-eto-za-programma/

Утилиты командной строки для OCR

Далее будут рассмотрены движки оптического распознавания символов, которые имеют интерфейс командной строки. Эта информация может пригодиться продвинутым пользователям, привыкшим иметь дело с консолью, а также пользователям OCRFeeder, поскольку эта программа умеет работать с каждым из рассмотренных ниже OCR инструментов, и знание их особенностей и различий помогут вам правильно выбрать используемый движок OCR:

Ocrad

Ocrad — это система оптического распознавания, разрабатываемая в рамках проекта GNU. Программа использует метод выделения характерных признаков (feature extraction). Она читает побитовое изображение в формате pgm/pbm и генерирует текст в байтовом (8-битном) формате. Ocrad содержит анализатор макета, способный отделять столбцы или блоки текста, часто встречающиеся в печатных страницах. К сожалению, поддержка русского языка также отсутствует напрочь. Поэтому из нашего сравнения программу исключаем.

Аналоги WinRar: 7-zip и HaoZip

Несмотря на то, что программой WinRar можно пользоваться бесплатно, она просто иногда просит заплатить за неё $29, в противном случае будет показываться реклама. Если учесть, что большинство пользователей видят WinRar только через контекстное меню, то реклама не так уж страшна. Но всё же эта программа платная и наше дело найти ей замену. Благо, архиваторов сейчас море. Один из самых популярных и удобных — это 7-zip. Он умеет работать с форматами RAR, ZIP, 7z, ARJ, ISO, TAR, GZIP и BZIP2. Принцип действия здесь такой же, да и выглядит программа ничуть не хуже, чем проприетарный WinRar.

Как вариант, можно ещё присмотреться к китайскому архиватору HaoZip. Он поддерживает более 35 форматов и также является бесплатным. Официально он не русифицирован, но пользователи сделали для него русский языковой пакет.

Tesseract

Tesseract — это движок оптического распознавания символов (OCR) с открытым исходным кодом. Его можно использовать напрямую, с помощью API для извлечения печатного текста из изображений, а также программы с графическим интерфейсом, такие как OCRFeeder, могут использовать Tesseract. Этот движок поддерживает большое количество языков. Пакет включает в себя утилиту командной строки.

Использование:

tesseract —help | —help-psm | —help-oem | —version tesseract —list-langs [—tessdata-dir ПУТЬ] tesseract —print-parameters [опции…] [конфигурационный файл…] tesseract имя_изображения|stdin вывод|stdout [опции…] [конфигурационный файл…]

OCR опции:

—tessdata-dir ПУТЬ Указать путь расположения tessdata. —user-words ПУТЬ Указать расположение пользовательского файла со словами. —user-patterns ПУТЬ Указать расположение пользовательского файла с образцами. -l ЯЗЫК[+ЯЗЫК] Указать язык(и), используемые для OCR. -c ПЕРЕМЕННАЯ=ЗНАЧЕНИЕ Установить значения конфигурационных переменных. Разрешено использовать аргумент -c несколько раз. —psm ЧИСЛО Указать режим сегментации страницы. —oem ЧИСЛО Указать режим движка OCR.ПРИМЕЧАНИЕ: Эти опции должны идти перед любым конфигурационным файлом.Режимы сегментации страницы: 0 Только ориентация и обнаружение скриптом (OSD). 1 Автоматическая сегментация страницы с OSD. 2 Автоматическая сегментация страницы но без OSD или OCR. 3 Полностью автоматическая сегментация страницы, но без OSD. (По умолчанию) 4 Предполагается единичная колонка текста переменной длины. 5 Предполагается единый унифицированный блок вертикально выравненного текста. 6 Предполагается единый унифицированный блок текста. 7 Обрабатывать изображение как единичную текстовую строку. 8 Обрабатывать изображение как единичное слово. 9 Обрабатывать изображение как единичное слово в круге. 10 Обрабатывать изображение как единичный символ. 11 Разреженный текст. Найти столько текста, сколько возможно без особого порядка. 12 Разреженный текст с OSD. 13 Сырая строка. Обрабатывать изображение как единичную текстовую строку, обход специфичных для Tesseract хаков.Режимы движка OCR: 0 Только оригинальный Tesseract. 1 Только Cube. 2 Tesseract + cube. 3 По умолчанию, основан на том, что доступно.Единичные опции: -h, —help Показать справку. —help-psm Показать режимы сегментации страницы. —help-oem Показать режимы движка OCR. -v, —version Показать информацию о версии. —list-langs Вывести список доступных языков для движка tesseract. —print-parameters Напечатать параметры tesseract в stdout (стандартный вывод).

Обратите внимание на опцию -l, после которой нужно указать используемый язык. Если он не указан, то подразумевается английский. Можно указать несколько языков, разделённых знаком плюс. Tesseract использует 3-символьные коды языков ISO 639-2.

Доступны следующие языки:

  • afr (африканские)
  • amh (амхарский)
  • ara (арабский)
  • asm (ассамский)
  • aze (азербайджанский)
  • aze_cyrl (азербайджанский — кириллица)
  • bel (белорусский)
  • ben (бенгальский)
  • bod (тибетский)
  • bos (боснийский)
  • bul (болгарский)
  • cat (каталанский; валенсийский)
  • ceb (кебуанский)
  • ces (чешский)
  • chi_sim (китайский упрощённый)
  • chi_tra (китайский традиционный)
  • chr (Cherokee)
  • cym (валлийский)
  • dan (датский)
  • dan_frak (датский — Fraktur)
  • deu (германский)
  • deu_frak (германский — Fraktur)
  • dzo (Dzongkha)
  • ell (греческий, современный (1453-))
  • eng (английский)
  • enm (английский, средние века (1100-1500))
  • epo (эсперанто)
  • equ (математика / модуль распознавания уровнений)
  • est (эстонский)
  • eus (баскский)
  • fas (перситский)
  • fin (финский)
  • fra (французский)
  • frk (франкский)
  • frm (французский, средние века (ca.1400-1600))
  • gle (ирландский)
  • glg (галисийский)
  • grc (чреческий, древний (до 1453))
  • guj (гуджаратский)
  • hat (гаитянский; гаитянский креольский)
  • heb (иврит)
  • hin (хинди)
  • hrv (хорватский)
  • hun (венгерский)
  • iku (язык инуктитут)
  • ind (индонезийский)
  • isl (исландский)
  • ita (итальянский)
  • ita_old (итальянский старый)
  • jav (яванский)
  • jpn (японский)
  • kan (язык каннада)
  • kat (грузинский)
  • kat_old (грузинский старый)
  • kaz (казахский)
  • khm (центральный кхмерский)
  • kir (киргизский)
  • kor (корейский)
  • kur (курдский)
  • lao (лаосский)
  • lat (латинский)
  • lav (латышский)
  • lit (литовский)
  • mal (малаялам)
  • mar (маратхи)
  • mkd (македонский)
  • mlt (мальтийский)
  • msa (малайский)
  • mya (бирманский)
  • nep (непальский)
  • nld (голландский, фламандский)
  • nor (норвежский)
  • ori (ория)
  • osd (модуль определения ориентации и скриптов)
  • pan (пенджабский)
  • pol (польский)
  • por (португальский)
  • pus (пушту; пушто)
  • ron (румынский, молдавский)
  • rus (русский)
  • san (санскит)
  • sin (сингаль, сингальский)
  • slk (словацкий)
  • slk_frak (словацкий — Fraktur)
  • slv (словенский)
  • spa (испанский, кастильский)
  • spa_old (испанский, кастильский — старые)
  • sqi (албанский)
  • srp (сербский)
  • srp_latn (сербский — латинский)
  • swa (суахили)
  • swe (шведский)
  • syr (сирийский)
  • tam (тамильский)
  • tel (телугу)
  • tgk (таджикский)
  • tgl (тагальский)
  • tha (тайский)
  • tir (тигринья)
  • tur (турецкий)
  • uig (уйгуро; уйгурский)
  • ukr (украинский)
  • urd (урду)
  • uzb (узбекский)
  • uzb_cyrl (узбекский — кириллица)
  • vie (вьетнамский)
  • yid (идиш)

Tesseract

Tesseract — свободная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х. Затем ее разработка была заморожена на 10 лет. В августе 2006 г Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.
Так как в репозиториях Ubuntu присутствует 2-я версия программы, а русский язык поддерживается только с релиза 3.0.0, программу я собирал из исходных текстов по инструкциям, найденным в сети.
Итак, скачиваем здесь архив с исходными текстами (в моем случае это tesseract-3.00.tar.gz, но с выходом новых версий название может быть другим), распаковываем его и переходим в директорию с исходными кодами.
Для корректной работы tesseract необходим пакет leptonica — ПО с открытым исходным кодом, необходимое для приложений, работающих и анализирующих изображения. Устанавливаем его:

$ sudo apt-get install leptonica-progs$ sudo ldconfig

Кроме того, для работы tesseract необходимо установить следующие пакеты: libpng12-dev, libjpeg62-dev, libtiff4-dev, zlib1g-dev, libtool build-essential. Устанавливаем и их, а затем из директории с исходным кодом начинаем конфигурирование и сборку программы:

$ ./runautoconf$ ./configure$ make$ sudo checkinstall

При подтверждении опций необходимо изменить имя пакета (номер 2) на tesseract-ocr.

изменение имени пакета на tessract-ocr

Все остальные опции принимаем по умолчанию. В результате будет установлен tesseract 3.0, а также собран deb-пакет, поэтому в следующий раз программу можно будет устанавливать обычным способом с помощью GDebi.
С первого раза программа у меня не собралась, пожаловавшись на отсутствие каталога /usr/local/share/tessdata. После того, как я создал его вручную, процесс завершился благополучно.
Теперь необходимо скачать с сайта программы пакет поддержки русского языка (rus.traineddata.gz), распаковать его и скопировать содержимое архива (а это должен быть один файл rus.traineddata) в директорию /usr/local/share/tessdata/.
Изображения перед распознаванием необходимо прнобразовать в формат tiff.
Для распознавания я использовал команду вида:

$ tesseract sample.tiff sample.txt -l rus

Если программа не заработала и возникают ошибки, связанные с отсутствием необходимых библиотек или правами доступа, выполните следующие команды:

$ sudo chmod 777 /usr/local/share/tessdata/*.traineddata$ export LD_LIBRARY_PATH=/usr/local/lib[/code]

Теперь все должно работать.
Для tesseract имеется графический интерфейс tesseract-gui, который тоже надо собирать из исходного кода. У меня он запустился, но распознавать текст почему-то не захотел. Еще есть система OCRopus, которая может использовать движок tesseract. Собственно поэтому я ее отдельно рассматривать не стал.

Ocrad

GNU Ocrad это OCR (Optical Character Recognition — оптическое распознавание символов) программа, основывающаяся на методе извлечения признаков. Она считывает битовую карту изображения в формате pgm/pbm и выдаёт текств в байтовом (8-бит) или UTF-8 форматах.

Ocrad включает анализатор разметки, способный разделять столбцы или блоки текста, какие обычно бывают на печатных страницах.

Для лучшего результата символы должны быть по крайней мере 20 пикселей в высоту. Если они меньше, попробуйте опцию —scale. Сканированные изображения на 300 dpi обычно дают размер символов достаточно хорошего размера для ocrad.

Слитые, очень смелые или очень светлые (сломанные) символы обычно не распознаются правильно. Старайтесь избегать их.

Использование:

ocrad [опции] [файлы]

Опции:

-h, —help показать справку и выйти -V, —version вывести информацию о версии и выйти -a, —append добавить текст к файлу вывода -c, —charset=<имя> попробуйте ‘—charset=help’ для получения списка имён -e, —filter=<имя> попробуйте ‘—filter=help’ для получения списка имён -E, —user-filter=<файл> определённый пользователем фильтр, смотрите мануал для получения форматов -f, —force принудительно переписать файл вывода -F, —format=<fmt> формат вывода (byte, utf8) -i, —invert инвертировать уравни изображения (белый на чёрном) -l, —layout выполнить анализ макета -o, —output=<файл> поместить вывод в <файл> -q, —quiet подавить все сообщения -s, —scale=[-] масштабировать входное изображение на [1/]<n> -t, —transform=<имя> попробуйте ‘—transform=help’ для получения списка имён -T, —threshold=<n%> порог для бинаризации (0-100%) -u, —cut=<l,t,w,h> обрезать входное изображение по заданному прямоугольнику -v, —verbose быть вербальной -x, —export=<файл> экспортировать результаты в формат ORF в <файл>

Если файлы не указаны, то ocrad считывает изображения из стандартного ввода. Если опция -o не указана, ocrad отправляет текст в стандартный вывод.

Статусы выхода: 0 для нормального выхода, 1 при проблемах в среде (файл не найден, неверные флаги, ошибки ввода/вывода и т.д.), 2 говорит о повреждённом или неверном файле ввода, 3 для ошибки внутренней консистенции (например, баг), которая вызвала панику в ocrad.

SILVERCODERS OCR Server

Данная программа представляет собой мощную коммерческую серверную систему распознавания, предназначенную для предприятий и поддерживающую 189 языков, среди них и русский. Она разработана специально для интегрирования в корпоративные системы документооборота. Триальной версии для свободного скачивания нет, поэтому опробовать мне эту систему не удалось.

img2txt

img2txt — многоязычный онлайн-сервис для оптического распознавания текста. Поддерживаются форматы JPG, PNG, TIFF с размером файла до 2 Мб. В будущем обещают поддержку PDF и DJVU. На Википедии сервис обозначен как коммерческий и проприетарный, однако на самом сайте никакой информации об типе лицензии и используемом движке нет. Мои три тестовые страницы распознались без проблем. Никакой оплаты или хотя бы регистрации не просили.

ocropy

ocropy — это написанный на Python OCR пакет, использующий рекуррентные нейронные сети (ранее назывался OCRopus).

ocropy — это коллекция программ для анализа документов, это не простая OCR система, которая распознаёт тексты в графическом интерфейсе или с запуском одной команды. Функции ocropy разбиты на отдельные модули и, например, для простого распознавания текста может потребоваться ввести несколько команд для подготовки документа.

В дополнении к самим скриптам распознавания, имеется ряд скриптов для базового редактирования и коррекции, измерению процента ошибок, определению матриц путаницы и т. п.

Установка OCRFeeder в Arch Linux, BlackArch и их производные:

git clone https://aur.archlinux.org/ocropy.gitcd ocropymakepkg -si

Результаты сравнительного тестирования систем оптического распознавания

Программа (сервис) Точность распознавания, %
Образец 1 Образец 2 Образец 3
FineReader for Linux 100% 100% 87%
FineReader Online 100% 100% 94%
Cuneiform 1.0.0 94% 94% 17%
Tesseract 3.0.0 97% 98% 5%
Free OCR 96% 93% 61%
img2txt 96% 94% 24%
NewOCR 94% 94% 41%
Google Docs 93% 96% 58%
Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...