Программы распознавания текста

Для того, чтобы текст можно было редактировать, мало его отсканировать: надо его еще и распознать. При сканировании лист бумаги превращается в картинку на мониторе. А при распознавании картинка превращается в текст. Так что если нужно еще отредактировать текст в редакторе, необходимо поставить программу распознавания текста при сканировании. Есть платные и бесплатные программы. Они с разным успехом работают с разными языками. Качественнее всего русский язык распознает ABBYY FineReader. Давайте сравним программы.

ПрограммаКачествоОграниченияГде скачать
ABBYY FineReader5В пробной версии 100 страниц на 30 дней бесплатно. Программа качественная, цена 7000рhttps://www.abbyy.com/ru-ru/finereader
Microsoft OneNote4https://www.onenote.com
OCR CuneiForm3Погуглите по каталогам софта
OmniPage 185Пробная версия дается только на корпоративную почту. Качественная, цена $150.http://www.nuance.com
WinScan2PDFЭто просто конвертер картинок в pdf, а не распознавательПогуглите по каталогам софта

Сравнивать будем на примере – есть скан свидетельства ИНН размером 1275×1750 разрешением 150dpi, вот его и распознаем.

ABBYY FineReader

Лучше всех под русский язык заточен ABBYY FineReader . Это и понятно, ведь ABBYY – российская компания. Если вам необходимо работать с текстом постоянно, то придется наверно купить программу, потому что бесплатных сравнимых по качеству программ нет. Судите сами, вот результат сканирования (дальше будет существенно хуже):

Результат распознавания текста в программе Abbyy Finereader
Результат распознавания текста в программе Abbyy Finereader

Личные данные распознаны, просто замазаны синим

Единственное, почему-то нижнюю часть свидетельства он не распознал – наверно, из-за печати.

Если вам не надо постоянно распознавать картинки, то можно воспользоваться пробной версией – у вас будет 30 дней на распознавание 100 страниц. Еще 10 страниц можно распознать в онлайн-версии программы. Качество десктопной и онлайн-версии одинаково.

Плюсы:

  • Качество
  • Интерфейс
  • Многообразие форматов файла

Минусы:

  • Цена, ограничения пробной версии
  • Большой размер
  • Долгое время установки

Если вам надо распознать текст разово, и покупать программу вы не собираетесь, то я бы воспользовалась онлайн-версией, не заморачиваясь установкой – это быстрее, а качество одинаково.

Microsoft OneNote

Это приложение, возможно, у вас стоит в пакете Майкрософт офис, проверьте. Но если нет, можно скачать и установить, это бесплатная программа, ограничений нет.

Результат распознавания текста в программе Microsoft OneNote
Результат распознавания текста в программе Microsoft OneNote

Как видно, качество пониже. Вытаскивает голый текст (в Abbyy Finerreader текст по возможности компонуется с картинками).

Плюсы:

  • Бесплатность
  • Качество, хотя хуже Finereader

Минусы:

  • Размер установочного файла большой
  • Устанавливается долго

 

Это приложение предназначено для заметок, распознавание идет бонусом. Распознавать просто, главное – не забудьте выбрать русский язык. Я сначала забыла, и подумала, что оно распознает совсем плохо. Но это не так. Чтобы установить русский язык, выполните следующее:

  1. Вставьте картинку
  2. Щелкните картинку правой кнопкой мыши, выберите русский язык.
  3. Выберите «Копировать текст из рисунка».
  4. Поместите курсор в место вставки текста и нажмите сочетание клавиш Ctrl+V. Текст будет вставлен.

OCR CuneiForm

Это давно не обновляемая программа российской компании. Но распознает картинки, вот результат:

Результат распознавания текста в программе OCR CuneiForm
Результат распознавания текста в программе OCR CuneiForm

Результат немного хуже, чем в OneNote. Говорят, для CuneiForm качество исходника имеет большее значение. То есть будь тут разрешение не  150, а 300 dpi, результат возможно улучшился бы. Но я не проверяла.

Плюсы:

  • Бесплатность.
  • Не ресурсоемкая, занимает мало места.
  • Распознает.

Минусы:

  • Старый интерфейс
  • Отсутствует на сайте разработчика Cognitive Technologies ввиду устаревания, а скачивать из каталогов опасно.

 

Если качество исходного файла приличное, то программа его распознает.

OmniPage 18

Это программа дорогая, качественная, современная, но надо проверять, как она работает с русским языком. Скачать ее не удалось, поскольку пробная версия дается только на корпоративную почту – надо указать кто вы, какую компанию представляете. И тогда пробная версия будет.

Плюсы:

  • Наверно качество.

Минусы:

  • Трудно получить пробную версию и оценить: требуется корпоративная почта.

WinScan2PDF

Эту программу я решила упомянуть, потому что она во многих обзорах фигурирует как OCR-распознавание текста, но это не так. Это не распознаватель, а конвертер. Программа просто конвертирует изображение в PDF-файл, в котором нельзя выполнить текстовый поиск и скопировать текст. Ведь PDF файлы бывают двух видов: действительно текстовые и сделанные из изображений. Тут как раз второй случай. Результат выглядит как текст, причем идеально правильный, но секрет в том, что это та же самая картинка. Ни выделить, ни скопировать, ни отредактировать этот текст нельзя.

Заключение

Итак, для рядового пользователя, желающего распознать бесплатно текст, есть три основные альтернативы  ABBYY FineReader на месяц, Microsoft OneNote надолго и OCR CuneiForm надолго. Качественнее всех FineReader. Если его использование закончилось, то Microsoft OneNote на втором месте по качеству. OCR CuneiForm на третьем месте, и он подойдет, если исходная картинка качественная.

Кроме того, рекомендую рассмотреть варианты онлайн распознавания текста: их больше.

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *