Распознавание текста онлайн — ТОП-9 сервисов

Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.

Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.

Для примера распознавала фотографию документа, который есть у каждого – свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).


СервисНужна регистрацияРейтингАдрес
Googleда3https://drive.google.com/drive
Abbyy Finereaderда5https://finereaderonline.com/ru-ru
Online OCR2-5 http://www.onlineocr.net
Free Online OCR-2https://www.newocr.com
OCR Convert-4http://www.ocrconvert.com
Free OCR-1www.free-ocr.com
I2OCR-4http://www.i2ocr.com
Яндекс ОCRРаспознает и переводит.5https://translate.yandex.ru/ocr
ConvertioРаботает своеобразно3https://convertio.co/ru/ocr/

Google

В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.

Входные форматы PDF , JPEG, PNG, GIF
Выходные форматы Word, Open Document, RTF, Adobe PDF, HTML, Text Plain, Epub (но форматирование исчезает – нарушается компоновка картинок с текстом)
Размер файла До 2 Мб
Ограничения Ограничено только размером хранилищ Google.

Качество исходника рекоменовано не меньше 10 пикселей по высоте для строки.

Качество Так себе – качество распознавания свидетельства инн хуже, чем с Finereader. И ФИО, и номер инн полностью потеряны.

Как пользоваться

У вас должен быть Google-аккаунт для пользования сервисом, если есть почта gmail – подойдет аккаунт от нее.
  1. Загрузите файл на страницу drive.google.com  или выберите там уже загруженную картинку
  2. Нажмите правой кнопкой мыши на нужный файл.
  3. Выберите “Открыть с помощью” –>  “Google Документы”.google disc ocr
  4. Картинка преобразуется в документ Google и откроется на вкладке https://docs.google.comДокументы Google - OCR

Abbyy Finereader

В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия – можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р).  Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.

Бесплатно доступно не более 10 страниц в две недели.
Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG
Выходные форматы Word, Excel, Power Point, Open Document, RTF, Adobe PDF,  Text Plain, Fb2, Epub
Размер файла До 100Мб
Ограничения 10 картинок на две недели
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как  у Online OCR  – какие-то части документа лучше распознались тем сервисом, а какие-то – этим.

 

inn
Результат распознавания Finereader. (ФИО и город распознаны, но стерты вручную)

Как пользоваться

  1. Загрузите файлы
  2. Выберите язык
    finereader-online
  3. Выберите выходной формат
  4. Щелкните кнопку «Распознать»
    finereader-online

Распознавание текста онлайн без регистрации

Online OCR

Online OCR  http://www.onlineocr.net/  – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:

online-ocr-inn
Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)
Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG, GIF
Выходные форматы Word, Excel, Adobe PDF,  Text Plain
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Распознает не более 15 картинок в час без регистрации
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим.

Как пользоваться

  1. Загрузите файл (щелкните «Select File»)
  2. Выберите язык и выходной формат
  3. Введите капчу и щелкните «Convert»

online-ocr

Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым

Free Online OCR

Free Online OCR  https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).

Входные форматы PDF, DjVu  JPEG, PNG, GIF, BMP, TIFF
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Ограничения на количество нет
Качество Качество распознавания свидетельства инн плохое.

Можно распознавать как все целиком, так и выделить  часть изображения для распознавания.

 Как пользоваться

  1. Выберите файл или вставьте url файла и щелкните «Preview» – картинка загрузится и появится в окне браузера
    Не забудьте правильно указать язык.
  2. Выберите область сканирования (можно оставить целиком как есть)Free online ocr
  3. Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»Free online ocr
  4. Внизу появится окно с текстом

OCR Convert

OCR Convert http://www.ocrconvert.com/ txt

Входные форматы Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 5Мб общий размер файлов за один раз.
Ограничения Одновременно до 5 файлов. Сколько угодно раз.
Качество Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader

 

Как пользоваться

      1. Загрузите файл, выберите язык и щелкните кнопку «Process»

ocr-convert

      1. Появится ссылка на файл с распознанным текстом

ocr-convert

Free OCR

Free OCR www.free-ocr.com распознал документ хуже всех.

Входные форматы PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 6Мб
Ограничения У PDF-файла распознается только первая страница
Качество Качество распознавания свидетельства инн низкое – правильно распознано только три слова.

Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Щелкните кнопку “Start”

free-ocr

I2OCR

I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.

Входные форматы JPG, PNG, BMP, TIF, PBM, PGM, PPM
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 10Мб
Ограничения нет
Качество Качество распознавания свидетельства инн среднее – сравнимо с OCR Convert.

Замечено, что сервис временами не работает.

Как пользоваться

  1. Выберите язык
  2. Загрузите файл
  3. Введите капчу
  4. Щелкните кнопку «Extract text»
  5. По кнопке «Download» можно загрузить выходной файл в нужном формате
      1. i2ocr

Яндекс OCR

Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.

Просто перейдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и щелкните “Открыть в Переводчике”. Откроется как текст с картинки, так и перевод в правом поле.

Перетащите картинку
Перетащите картинку
Результат распознавания
Результат распознавания

Convertio

Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, поэтому сравнивать его тяжело. В целом не понравился. Свидетельство ИНН, загруженное целиком, он не распознал совсем, так как плохо выделяет текст среди картинок. Не распозналось ни одного слова! Для его проверки я вырезала текстовый кусочек из ИНН и распознала его – это удалось сделать.

К тому же временами он зависает в попытках что-либо распознать.

Входные форматы pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp, webp
Выходные форматы Text Plain, PDF, Word , Excel, Pptx, Djvu, Epub, Fb2, Csv
Размер файла ?, зависит от тарифа
Ограничения 10 страниц бесплатно, дальше тарифы от 7 долларов.
Качество Сложно оценить – файл с картинками (ИНН) не распознал совсем, отдельно вырезанный кусок текста распознал.

Замечено, что  при распознавании сервис временами зависает, возможно ваши картинки ставятся в большую очередь на бесплатном тарифе.

Как пользоваться

  1. Загрузите файл
  2. Выберите язык
  3. Выберите выходной формат
  4. Введите капчу
  5. Щелкните “Преобразовать”
  6. Чтобы увидеть результат, промотайте наверх к форме загрузки файлов. Там же можно будет и скачать результат.
Интерфейс Convertio

Вырезанный и распознанный кусок (целиком не распознается):

Результат работы Convertio
Результат работы Convertio

Заключение

Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.

Хуже всего сработал Free OCR – он распознал всего три слова.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *