Для того, чтобы текст можно было редактировать, мало его отсканировать: надо его еще и распознать. При сканировании лист бумаги превращается в картинку на мониторе. А при распознавании картинка превращается в текст. Так что если нужно еще отредактировать текст в редакторе, необходимо поставить программу распознавания текста при сканировании. Есть платные и бесплатные программы. Они с разным успехом работают с разными языками. Качественнее всего русский язык распознает ABBYY FineReader. Давайте сравним программы.
Программа | Качество | Ограничения | Где скачать |
---|---|---|---|
ABBYY FineReader | 5 | В пробной версии 100 страниц на 30 дней бесплатно. Программа качественная, цена 7000р | https://www.abbyy.com/ru-ru/finereader |
Microsoft OneNote | 4 | https://www.onenote.com | |
OCR CuneiForm | 3 | Погуглите по каталогам софта | |
OmniPage 18 | 5 | Пробная версия дается только на корпоративную почту. Качественная, цена $150. | http://www.nuance.com |
WinScan2PDF | Это просто конвертер картинок в pdf, а не распознаватель | Погуглите по каталогам софта |
Сравнивать будем на примере – есть скан свидетельства ИНН размером 1275×1750 разрешением 150dpi, вот его и распознаем.
ABBYY FineReader
Лучше всех под русский язык заточен ABBYY FineReader . Это и понятно, ведь ABBYY – российская компания. Если вам необходимо работать с текстом постоянно, то придется наверно купить программу, потому что бесплатных сравнимых по качеству программ нет. Судите сами, вот результат сканирования (дальше будет существенно хуже):
Личные данные распознаны, просто замазаны синим
Единственное, почему-то нижнюю часть свидетельства он не распознал – наверно, из-за печати.
Если вам не надо постоянно распознавать картинки, то можно воспользоваться пробной версией – у вас будет 30 дней на распознавание 100 страниц. Еще 10 страниц можно распознать в онлайн-версии программы. Качество десктопной и онлайн-версии одинаково.
Плюсы:
- Качество
- Интерфейс
- Многообразие форматов файла
Минусы:
- Цена, ограничения пробной версии
- Большой размер
- Долгое время установки
Если вам надо распознать текст разово, и покупать программу вы не собираетесь, то я бы воспользовалась онлайн-версией, не заморачиваясь установкой – это быстрее, а качество одинаково.
Microsoft OneNote
Это приложение, возможно, у вас стоит в пакете Майкрософт офис, проверьте. Но если нет, можно скачать и установить, это бесплатная программа, ограничений нет.
Как видно, качество пониже. Вытаскивает голый текст (в Abbyy Finerreader текст по возможности компонуется с картинками).
Плюсы:
- Бесплатность
- Качество, хотя хуже Finereader
Минусы:
- Размер установочного файла большой
- Устанавливается долго
Это приложение предназначено для заметок, распознавание идет бонусом. Распознавать просто, главное – не забудьте выбрать русский язык. Я сначала забыла, и подумала, что оно распознает совсем плохо. Но это не так. Чтобы установить русский язык, выполните следующее:
- Вставьте картинку
- Щелкните картинку правой кнопкой мыши, выберите русский язык.
- Выберите «Копировать текст из рисунка».
- Поместите курсор в место вставки текста и нажмите сочетание клавиш Ctrl+V. Текст будет вставлен.
OCR CuneiForm
Это давно не обновляемая программа российской компании. Но распознает картинки, вот результат:
Результат немного хуже, чем в OneNote. Говорят, для CuneiForm качество исходника имеет большее значение. То есть будь тут разрешение не 150, а 300 dpi, результат возможно улучшился бы. Но я не проверяла.
Плюсы:
- Бесплатность.
- Не ресурсоемкая, занимает мало места.
- Распознает.
Минусы:
- Старый интерфейс
- Отсутствует на сайте разработчика Cognitive Technologies ввиду устаревания, а скачивать из каталогов опасно.
Если качество исходного файла приличное, то программа его распознает.
OmniPage 18
Это программа дорогая, качественная, современная, но надо проверять, как она работает с русским языком. Скачать ее не удалось, поскольку пробная версия дается только на корпоративную почту – надо указать кто вы, какую компанию представляете. И тогда пробная версия будет.
Плюсы:
- Наверно качество.
Минусы:
- Трудно получить пробную версию и оценить: требуется корпоративная почта.
WinScan2PDF
Эту программу я решила упомянуть, потому что она во многих обзорах фигурирует как OCR-распознавание текста, но это не так. Это не распознаватель, а конвертер. Программа просто конвертирует изображение в PDF-файл, в котором нельзя выполнить текстовый поиск и скопировать текст. Ведь PDF файлы бывают двух видов: действительно текстовые и сделанные из изображений. Тут как раз второй случай. Результат выглядит как текст, причем идеально правильный, но секрет в том, что это та же самая картинка. Ни выделить, ни скопировать, ни отредактировать этот текст нельзя.
Заключение
Итак, для рядового пользователя, желающего распознать бесплатно текст, есть три основные альтернативы ABBYY FineReader на месяц, Microsoft OneNote надолго и OCR CuneiForm надолго. Качественнее всех FineReader. Если его использование закончилось, то Microsoft OneNote на втором месте по качеству. OCR CuneiForm на третьем месте, и он подойдет, если исходная картинка качественная.
Кроме того, рекомендую рассмотреть варианты онлайн распознавания текста: их больше.