Программа для распознавания сканированных изображений. Программа для распознавания текста с картинки

Распознавание текста – очень удобная возможность. Вам больше не надо перепечатывать большие объемы из книг и статей. Для учителей, студентов и научных работников такие программные приложения – настоящий подарок. Рассмотрим разные приложения и определим, какая программа для распознавания текста с картинки – лучшая.

Как это работает

Оптическое распознавание текста (OCR - Optical Character Recognition) – это возможность преобразовать текст из графического вида (фото, скан, pdf) в обычный формат. Преобразованный текст можно редактировать.
Любая растровая картинка состоит из точек. Программное обеспечение для распознавания выделяет на картинке буквы и переводит их в текст. Происходит анализ структуры документа. Выделяются текстовые блоки. Затем строятся линии, которые делятся на слова, а далее на символы. Каждый символ сравнивается с шаблонами. После чего строятся гипотезы, что это за символ. Исходя их них, ПО анализирует разные варианты разбиения строк на слова, а слова на символы. Количество таких гипотез огромно. В конец концов программа принимает решение и выдает текст.

Обзор программного обеспечения

Условно все приложения можно разделить на три категории:

  • Платные.
  • Бесплатные.
  • Онлайн сервисы.

Рассмотрим несколько вариантов из каждого раздела.

Платные и бесплатные программы

OCR CuneiForm

Бесплатная программа для распознавания сканированного текста, которую можно скачать здесь.

Приложение было разработано в 1993 году в компании Cognitive Technologies. Одной из главных особенностей ее на тот момент была возможность опознавания смеси русского и английского языков. В 2009 году была добавлена ветка, которая позволяет распознавать смесь других языков. Программный продукт поставлялся со сканерами и МФУ от ведущих производителей: Hewlet-Pachard, Epson, Xerox и т.д. Последняя версия вышла в 2009 году.
После скачивания и установки пробуем распознать текст. Для примера возьмем эту статью.

Интерфейс программы прост, меню на русском.


Нажимаем значок папки и грузим картинку. Нажимаем кнопку распознавания.


Результат не впечатляет. Разноцветный текст не распознан.


Не смотря на заявленное использование разных словарей, английский тоже распознался плохо.


В общем, идеальное фото можно перевести в символы, но чем ниже качество исходной картинки, тем ниже оно и у результата.
Надо заметить, это единственная русифицированная программа распознавания текста при сканировании, которую удалось скачать бесплатно легальным образом. Все остальные в лучшем случае имеют пробный бесплатный период.

RiDoc

Программа для распознавания текста с фото или со сканера с бесплатным периодом в 30 дней. Скачать можно здесь.

Приложение обладает неплохим функционалом и доступным интерфейсом. Для загрузки картинки нажимаем кнопку «Открыть».


Далее кнопку «Распознать».


В итоге получаем готовый результат. Его можно открыть в Word или OpenOffice.


Вот результат.


Тоже не идеально, но намного больше, чем в предыдущем случае.
Также можно наложить водяной знак или склеить несколько картинок.

ReadIris

Платный программный продукт с пробной версией, рассчитанной на 100 страниц или 10 дней. Скачать программу для сканера для распознавания текста с официального сайта можно тут.

Разработчик – бельгийская компания IRIS, созданная в 1986 году. Основная специализация - технологии и продукты для интеллектуального распознавания документов.

Программа преобразует картинку, файл PDF или отсканированный документ в полностью редактируемый текстовый файл. Извлекает текст из ваших документов, сохраняя при этом макет исходного файла. Имеет следующие возможности:

  • конвертировать файлы Word, Excel и PowerPoint в индексированные PDF-файлы;
  • конвертация документов с помощью контекстного меню;
  • индикатор качества для импортируемых документов;
  • автоматическое обнаружение сканеров;
  • модуль коррекции перспективы.

Интерфейс программы русифицирован (указывается при установке) и достаточно прост.


Нажимаем кнопку «Из файла» и выбираем нашу картинку. Программа автоматически разделила ее на два блока.


Для распознавания нажмите кнопку «Открыть» и укажите путь для картинки. Формат указывается строкой выше.


Результат превзошел все ожидания. Даже начертание сохранилось.


Можно отправить документ по почте или в облако. Для этого следует щелкнуть по списку сверху и выбрать. По умолчанию сохраняется в файл.


Стоит эта программа около 6000 руб.

ABBYY FineReader

Самая известная и раскрученная программа. Скачать пробную версию можно здесь.

Платная стоит 6990 р. Российская разработка 1993 года, до сих пор считается одной из лучших в мире. Основные возможности:

  • Распознавание таблиц и графиков, математических формул.
  • Просмотр и навигация pdf.
  • Создание и прямое редактирование pdf.
  • Работа с цифровой подписью.
  • Сравнение документов.
  • Добавление комментариев.

Программа обладает множеством возможностей. Интерфейс русифицирован и доступен.


После нажатия кнопки «Открыть» и выбора картинки, начинается автоматическое его деление на блоки.


Для начала процесса нажмите соответствующую кнопку.


Дальше осталось выбрать, в каком формате сохранять и указать папку, в которую следует сохранить документ.


Откроем результат. Как видите, распознавание прошло идеально.


Еще раз сравним с ReadIris.


Первый вариант (Finereader) выполнен безупречно. Поэтому, пожалуй, пальму первенства отдаем этой программе. По цене они сопоставимы, так что разница в 600-700 рублей особой роли не играет.

Распознавание текста по фото онлайн

IMGonline

Онлайн сервис обработки картинок. На сайте представлены инструменты:

  • Сжатие и изменение размера картинки
  • Обрезка, кадрирование
  • Обработка встроенных метаданных
  • Эффекты
  • Улучшения
  • Определение палитры цветов картинки
  • Получение фона
  • Определение процента похожести и пр.

Удобный сайт, который дает множество возможностей обработки картинки. Интерфейс прост и понятен.


Предлагает две программы. Сравним. Загрузим файл и нажмем кнопку «ОК».


Дальше нажимаем на ссылку.


Результат не радует.


Пробуем вторую программу.


Тоже сомнительно.


Выставим дополнительный язык.


Проверяем результат.

Немного лучше, но до совершенства далеко.

img2txt

Программа для распознавания текста с фото онлайн, сканирования не допускает.

Сайт функционирует с 2014 года. Других сервисов, кроме текущего, разработчики не планируют.


Выберите файл и нажмите «Загрузить». Затем следует нажать «Начать распознавание».

Результат тоже далек от совершенства.

Сonvertio

Достаточно большой платный портал, на котором вы можете воспользоваться следующими возможностями:

  • Конвертация видео, аудио, картинок.
  • Преобразование PDF в Word, Excel, PowerPoint.
  • Разделение PDF.
  • Сжатие PDF, PNG и пр.

Принцип работы абсолютно аналогичен, но настроек больше. Картинки можно перетягивать.


Можно указать несколько языков и тип документа, куда сохраняется результат.


Незарегистрированным пользователям доступны только 10 страниц для распознавания.
После нажатия на каптчу, выберите «Преобразовать».


Нажмите скачать.


Результат превзошел все ожидания.


Оказывается, и у простых сервисов онлайн есть возможность качественного распознавания. Так что Convertio объявляется однозначным победителем в этой номинации. Но, как и любой отличный продукт, он платен.

Итак, мы рассмотрели различные инструменты распознавания текста. Выяснилось, что бесплатные могут помочь, но качество остается не на высоте. Так что, если вам постоянно требуется переводить текст из печатного вида в электронный, придется раскошелиться.

Отличного Вам дня!

Сталкивались ли вы с тем, что вам нужно что-то сканировать, например, какие-то документы? Будь это текстовые материалы или просто фотографии, программа RiDoc идеально подходит обычным «юзерам» т.к. имеет простой, практичный и предельно дружественный интерфейс.

RiDoc – это программа для сканирования документов , которая позволяет оцифровать информацию, то есть выполнить перенос информации с бумажного носителя на цифровой (жёсткий диск компьютера), тем самым упростить жизнь пользователю и сэкономить лес. Дополнительно такие документы можно отправлять посредством электронной почты или загружать в облачные хранилища, предоставлять доступ другим пользователям (в зависимости от задачи).

Кроме того RiDoc предоставляет функционал, способный регулировать размер цифрового документа (выбирая качество картинки). В интерфейсе имеется инструмент, позволяющий распознавать текст со сканера (текстовая информация), а также вести историю всех ранее отсканированных документов (например в pdf-формате).


Приложение позволяет сохранять цифровые варианты документов в наиболее распространенных форматах: bmp, tiff, jpeg, png, Word, PDF, что очень удобно, так как софт для работы с этими файлами есть у большинства компьютерных пользователей, кроме того соответствующие приложения всегда можно скачать бесплатно с нашего портала.

Чаще всего RiDoc используют в качестве программы для сканирования с hp и canon устройств в связи с тем, что последние пользуются небывалой популярностью для большинства юзеров. Но это ни в коем случае не говорит о том, что другие производители остались в стороне, – RiDoc отлично взаимодействует с любой доступной моделью сканера, поэтому можете смело скачать эту бесплатную программу для сканирования документов на русском языке.

Основные функциональные возможности программного обеспечения:

  • Имеется технология «быстрых папок», которые позволяют с комфортом управлять оцифрованными документами;
  • Если вы имеете бумажный текстовой документ, который хотите перенести на компьютер, то программа способна выполнить распознавание текста, который в дальнейшем можно отредактировать в любом популярном текстовом редакторе, например в OpenOffice или Microsoft Word;
  • Функция водяного знака. Пользователю предоставляется возможность произвести регулировку его размера , предварительно указав прозрачность;
  • Все отсканированные (оцифрованные) PDF документы можно поместить в один файл, для более компактного хранения, возможность установить единые параметры для каждой отдельной функции.
  • Имеется встроенный принтер RiDoc, который позволит вам экспортировать файлы в PDF формат;
  • Все отсканированные файлы естественным образом можно отправить на печать;

Рекомендуем данный софт, как незаменимое приложение, которое пригодится как студенту так и простому пользователю, а также станет незаменимым инструментом для офисного работника. Для того, чтобы скачать программу достаточно кликнуть по соответствующей кнопке внизу статьи.


Видеообзор:


Программы для распознавания текста позволяют конвертировать сфотографированные или отсканированные документы непосредственно в предложения.

Дело в том, что текст на изображении представлен в виде растра, набора точек. Упомянутый софт осуществляет превращение набора точек в полноценный текст, доступный для редактирования и сохранения.

Распознавание букв призвано оптимизировать процесс оцифровки бумажных печатных или рукописных книг, документов.

Такой метод оцифровки на порядки превосходит скорость ручного набора с изображения. Широко применяется при оцифровке библиотек и архивов. Далее рассмотрим пятерку лучших представителей семейства подобных программ.

ABBYY FineReader 10

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

  • пробная версия на 15 дней.

OCR CuneiForm

Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Интересно! CuneiForm распознает блоки текста, графические изображения и даже различные таблицы. Более того, считыванию поддаются даже неразлинованные таблицы.

Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства:

  • бесплатное распространение;
  • использование словарей для проверки правильности текста;
  • сканирование текста с ксерокопий плохого качества.

Недостатки:

  • относительно небольшая точность;
  • небольшое количество поддерживаемых языков.

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.

SimpleOCR

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

  • полное отсутствие русского языка.

Freemore OCR

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

Наверное, каждому знакома ситуация, когда скан документа, например, страницы книги, необходимо преобразовать в печатный текст. Для этого существуют специальные программы, но основная их масса очень мало кому известна. На слуху у всех, пожалуй, только ABBYY FineReader. Действительно, FineReader вне конкуренции. Это лучшая программа для сканирования и распознавания текста на русском языке, однако выпускается она исключительно в платных версиях и стоит весьма недешево. Многие ли готовы выложить за самую бюджетную лицензию почти 7 000 рублей, если собираются обрабатывать одну-две книги в год?

Если вы считаете покупку дорогостоящего коммерческого продукта неоправданной, почему бы не воспользоваться аналогами, среди которых есть бесплатные? Да, они не так богаты функциями, но со многими задачами, которые, как считают многие, «по зубам» только FineReader, справляются вполне успешно. Так давайте познакомимся с несколькими доступными альтернативами. И заодно посмотрим, чем они отличаются от общепризнанного эталона.

Чтобы сравнивать другие программы с ABBYY FineReader , выясним, чем же он так хорош. Вот перечень его основных функций:

  • Работа с фотографиями, сканами и бумажными документами.
  • Редактирование содержимого файлов pdf — текста, отдельных блоков, интерактивных элементов и прочего.
  • Конвертация pdf в формат Microsoft Word и обратно. Создание pdf-файлов из любых текстовых документов.
  • Сравнение содержимого документов на 35 языках, например, отсканированного бумажного и электронного (не во всех редакциях).
  • Распознавание и преобразование сканированных текстов, таблиц, математических формул.
  • Автоматическое выполнение рутинных операций (не во всех редакциях).
  • Поддержка 192 национальных алфавитов.
  • Проверка орфографии распознанного текста на русском, украинском и еще 46 языках.
  • Поддержка 10 графических и 10 текстовых форматов входных файлов, не считая pdf.
  • Сохранение файлов в графическом и текстовом форматах, а также в виде электронных книг EPUB и FB2.
  • Чтение штрих-кодов.
  • Интерфейс на 20 языках, включая русский и украинский.
  • Поддержка большинства существующих моделей сканеров.

Возможности программы великолепны, но для домашних пользователей, которые не обрабатывают документы в промышленных объемах, избыточны. Впрочем, тем, кому нужно распознать лишь несколько страниц, компания ABBYY предоставляет услуги бесплатно — через веб-сервис FineReaderOnline . После регистрации доступна обработка 10 страниц отсканированного или сфотографированного текста, в дальнейшем — по 5 страниц в месяц. Больше — за доплату.

Стоимость самой недорогой лицензии FineReader для установки на компьютер — 6990 рублей (версия Standard).

Крошечная и крайне простая бесплатная утилитка , конечно, не в состоянии конкурировать с монстром, но основную задачу — распознавание сканированного текста, решает как положено. Причем для этого она не требует даже установки на ПК (портабельная). И управляется всего тремя кнопками.

Для распознавания текста с помощью WinScan2PDF нажмите «Выбрать источник» и укажите подключенный сканер (с готовыми файлами программа, к сожалению, не работает). Поместите в сканер документ и нажмите «Сканировать». Если хотите отменить операцию, нажмите «Отмена». Вот и вся инструкция.

Утилита поддерживает 23 языка, включая русский, и работает с многостраничными файлами. Готовый результат сохраняется в формате pdf, скан документа — в jpg.

Веб-сервис Free-OCR.com

Free-OCR.com (OCR — Optical character recognition, оптическое распознавание символов) — бесплатный Интернет-сервис для распознавания отсканированных или сфотографированных текстов, сохраненных в формате графического изображения (jpg, gif, tiff, bmp) или pdf. Поддерживает 29 языков, включая русский и украинский, причем пользователь может выбрать не один, а несколько, если их содержит исходный текст.

Free-OCR не требует регистрации и не имеет каких-либо ограничений по количеству загруженных документов. Ограничивается только размер файла — до 6 Mb. Многостраничные документы сервис не обрабатывает, точнее, игнорирует всё, кроме первого листа.

Скорость распознавания сканированного текста довольно высока. Лист А4 с фрагментом книги на русском языке был обработан примерно за 5 секунд, но вот качество не порадовало. Крупные шрифты — как в детских книжках, он распознает на 100%, а средние и мелкие — примерно на 80%. С англоязычными документами дела обстоят несколько лучше — мелкий и неконтрастный шрифт распознался правильно примерно на 95%.

Веб-сервис Free Online OCR

— еще один бесплатный веб-сервис, очень похожий на предыдущий, но с расширенным функционалом. Он:

  • Поддерживает 106 языков.
  • Обрабатывает многостраничные документы, в том числе на нескольких языках.
  • Распознает тексты на сканах и фотодокументах множества типов. Помимо 10 форматов графических изображений, обрабатывает документы pdf, djvu, doxc, odt, архивы zip и сжатые файлы Unix.
  • Сохраняет выходные файлы в одном из 3 форматов: txt, doc и pdf.
  • Поддерживает распознавание математических уравнений.
  • Позволяет повернуть изображение на 90-180° в обе стороны.
  • Правильно распознает текст в нескольких столбцах на одной странице.
  • Может распознать один выбранный фрагмент.
  • После обработки предлагает скопировать файл в буфер обмена, скачать на компьютер, загрузить на сервис Google Docs или опубликовать в Интернете. Также доступна возможность сразу перевести текст на другой язык, используя Google Translate или Bing Translator.

Надо отдать должное Free Online OCR и за то, что он неплохо читает картинки низкого разрешения и малой контрастности. Результат распознавания всех скормленных ему русскоязычных текстов отказался стопроцентным или близким к этому.

Free Online OCR, по нашему мнению, одна из лучших альтернатив FineReader, но бесплатно он обрабатывает только 20 страниц (правда, не указано, за какой период). Дальнейшее использование сервиса стоит от $0,5 за страницу.

Microsoft OneNote

Программа для создания заметок Microsoft OneNote , исключая очень старые и последнюю — 17 версии, тоже содержит функционал OCR. Он не такой продвинутый как в специализированных приложениях, но тоже пригодный к использованию, если нет других вариантов.

Чтобы распознать текст с изображения с помощью OneNote, вставьте картинку в файл («Рисунок» — «Вставить»), нажмите на нее правой клавишей мышки и выберите «Копировать текст из рисунка».

После этого вставьте скопированный текст в любое место заметки.

По умолчанию языком распознавания назначен английский. Если вам нужен русский или какой-либо другой, измените настройку вручную.

Качество распознавания русскоязычного текста в Microsoft OneNote оставляет желать лучшего, поэтому его нельзя назвать полноценной заменой FineReader. Да и обрабатывать в нем большие многостраничные документы весьма неудобно.

SimpleOCR

Старенькая бесплатная программа SimpleOCR — тоже весьма достойный инструмент распознавания текстов с электронных изображений и сканов, но, к сожалению, без поддержки русского языка. Зато в ней есть уникальная функция считывания рукописных слов, а также редактор, позволяющий исправить ошибки перед сохранением готового результата.

Другие возможности SimpleOCR:

  • Проверка орфографии с возможностью пополнять словарь вручную.
  • Чтение документов в низком разрешении и с помарками (есть опция очистки «шума»).
  • Максимально близкая подборка шрифта и передача стилей написания (жирный, курсив). При желании функцию можно отключить.
  • Одновременная обработка нескольких листов или отдельного фрагмента.
  • Выделение возможных ошибок в готовом тексте для ручного редактирования.
  • Поддержка множества модификаций сканеров.
  • Входные форматы электронных документов: tif, jpg, bmp, ink, а также сканы.
  • Сохранение готового текста в форматах txt и doc.

Качество распознавания и печатных текстов, и рукописей довольно высокое.

Программу можно было бы назвать универсальной, если бы не ограничение языковой поддержки. Последняя версия поддерживает только английский, французский и датский языки, добавление других, скорее всего, не планируется. Интерфейс полностью на английском, но прост для понимания. Кроме того, в главном окне есть кнопка «Demo», которая запускает обучающий ролик по работе с SimpleOCR.

Программа бельгийской компании-разработчика I.R.I.S — вот это действительно настоящий конкурент российскому ABBYY FineReader. Мощная, быстрая, кроссплатформенная, основанная на фирменном OCR-движке, используемом производителями Adobe, HP и Canon, она великолепно распознает даже самые трудночитаемые тексты. Поддерживает 137 языков, среди которых есть русский и украинский.

Особенности и функции Readiris:

  • Самая высокая скорость обработки файлов среди приложений такого класса, рассчитано на большие объемы.
  • Сохранение форматирования исходного текста (шрифты, кегль, стиль написания).
  • Одиночная и пакетная обработка файлов, поддержка многостраничных документов.
  • Распознавание математических уравнений, специальных символов и штрих-кодов.
  • Очистка текста от «шумов» — линий, помарок и т. п.
  • Интеграция с различными облачными сервисами — Google Документы, Evernote, Dropbox, SharePoint и некоторыми другими.
  • Поддержка всех современных моделей сканеров.
  • Форматы входных данных: pdf, djvu, jpg, png и другие, в которых сохраняют графические изображения, а также полученное непосредственно со сканера.
  • Форматы выходных данных: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Поддерживается конвертация в djvu.

Интерфейс программы русскоязычный, использование интуитивно понятно. Она не предоставляет пользователям возможности редактировать содержимое файлов pdf, как FineReader, но с главной задачей — распознаванием текстов, на наш взгляд, справляется отлично.

Readiris выпускается в двух платных версиях. Стоимость лицензии Pro составляет 99,00€, Corporate — 199€. Почти как у ABBYY.

Freemore OCR

Freemore OCR — (! сайт программы http://freemoresoft.com/freeocr/index.php может блокироваться антивирусами из-за встроенного в установщик рекламного «мусора») — еще одна простая, компактная и бесплатная утилитка, которая тоже неплохо распознает тексты, но по умолчанию только на английском. Пакеты других языков нужно загружать и устанавливать отдельно.

Прочие функции и возможности Freemore OCR:

  • Одновременная работа с несколькими сканерами.
  • Поддержка множества форматов графических данных, в том числе проприетарных, вроде psd (файл Adobe Photoshop). Стандартные форматы графики поддерживаются все.
  • Поддержка pdf.
  • Сохранение готового результата в формате pdf, txt или docx, причем для экспорта текста в Word достаточно нажать одну кнопку на панели инструментов.
  • Встроенный редактор (к сожалению, форматирование исходного документа программа не сохраняет).
  • Просмотр свойств документа.
  • Печать распознанного текста прямо из главного окна.
  • Защита паролем файлов в формате pdf.

На первый взгляд интерфейс программы может показаться сложным, но на самом деле пользоваться ею очень легко. Инструменты поделены на группы, как на ленте Microsoft Office. Если рассмотреть их повнимательнее, назначение той или иной кнопки быстро станет понятным.

Чтобы загрузить электронный документ в окно Freemore OCR, сначала выберем его тип — изображение или файл pdf, и следом нажмем соответствующую кнопку «Load». Чтобы начать процесс распознавания, нажимаем на кнопку «OCR» в одноименной группе инструментов рядом с изображением волшебной палочки (показана на скриншоте).

Результат сканирования англоязычных текстов как с хорошо-, так и с плохочитаемой картинки оказался вполне удовлетворительным. Не понравилось лишь одно — то, что вместе с программой на компьютер устанавливается всякий мусор — какие-то липовые антивирусные сканеры, оптимизаторы и прочие ненужные вещи, причем без возможности отказаться от них во время установки. Словом, если бы не этот недостаток, приложение можно было бы рекомендовать в качестве неплохой бесплатной альтернативы FineReader.

Программа для оптического распознавания текстов. ABBYY FineReader умеет распознавать текст из отсканированных бумажных документов, PDF-файлов, а также документов, отснятых цифровым фотоаппаратом. Распознанные программой текстовые документы можно в дальнейшем редактировать, используя приложения Microsoft Office. Если нужно, то при распознавании текста будет сохранена вся структура оформления документов. FineReader работает со всеми популярными моделями современных сканеров и многофункциональных устройств (МФУ). Если пользователю нужно отсканировать и распознать большое количество страниц текста, то в программе предусмотрен специальный режим для работы с автоматическими сканерами (сканер с автоподатчиком бумаги). Программа может распознавать текст в файлах следующего формата: PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG, DjVu, при необходимости будет произведена обработка цифровых изображений для повышения качества оптического распознавания текста (изображение можно обрезать, очистить от ненужных элементов, устранить неточности, искажения строк, осуществить поворот или зеркальное отображение).

Программа представляет собой комплексное приложение для работы с текстовыми документами. Её основное назначение – оптическое распознавание символов. Создатель программы - российская кампания ABBYY Software (мировой лидер в области систем распознавания). Приложение осуществляет быстрый и точный перевод отсканированных документов в редактируемый формат, с сохранением всех оригинальных деталей источника. FineReader умеет распознавать PDF файлы, цифровые фотографии и бумажные документы. Программа точно воспроизводит вид оригинального источника, поддерживая распознавание текста на 186 языках и осуществляет прямой экспорт в приложения Microsoft Office.

С помощью приложения решаются такие задачи, как: создание и редактирование электронных документов на основе бумажных источников, перевод в редактируемый формат документов слабого качества, обработка документов со сложной структурой содержания, включающих таблицы, иллюстрации, схемы и т.д., поиск и редактирование текста в любых форматах. По мнению большинства специалистов, программа является лучшей в своей области.

Если говорить о практике использования этой программы в Рунете, то многим пользователям уже давно известна эта программа Файн Ридер (русский перевод названия), основное назначение которой – выполнение так называемого оптического распознавания текста. Если проще – с помощью этой программы любой напечатанный на бумаге текст может быть преобразован в один из электронных форматов. Последняя версия программы отличается не только обновленным и более удобным интерфейсом, но и улучшенной функциональностью.

Фактически, все основные действия могут быть выполнены посредством одного щелчка мыши, которым выбирается одно из предлагаемых при запуске программы действий. Среди них – возможность сканирования документов в формат.doc, конвертация фотографий, сканирование в Excel, сохранение изображений и их сканирование, распознавание изображений и др. С целью повышения удобства использования программы, рабочая область была увеличена, а кнопки, запускающие то или иное действие, находятся теперь на боковой панели.

Чтобы не затруднять пользователя, по умолчанию все файлы, которые он открывает, распознаются автоматически. При необходимости, опытный пользователь может выполнить глубокие настройки функционала FineReader. А работа с изображениями значительно упростилась благодаря новому диалогу. Использование приложения позволяет распознавать документы, составленные с использованием более чем одного языка, преобразовывать файлы PDF, распознавать штрих-коды и вести морфологический поиск. И хотя это далеко не полный перечень его возможностей, уже только это может сподвигнуть многих пользователей установить у себя на постоянной основе Файн Ридер и использовать его по мере необходимости.

И подводя черту под вышесказанным, можно вкратце так обозначить функциональные возможности: эта программа используется для оптического распознавания различных текстовых документов. При распознавании текста, программа сохраняет исходное форматирование и оформление документа (цветной текст, текст на фоне картинок, различные начертания шрифтов, обтекание картинок текстом, таблицы и т.д.). FineReader умеет работать с отсканированными бумажными документами (поддерживается работа практически со всеми популярными моделями сканеров и многофункциональных устройств), с документами, отснятыми цифровыми фотоаппаратами, распознаёт текст и графику из PDF файлов. А также экспортирует результаты оптического распознавания текстов в популярные офисные приложения: Word, Excel, PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice. Распознанный текст можно сохранить в различных форматах: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, Unicode TXT, Word ML, LIT, DBF.