Как распознать текст с картинки в Word: лучшие способы и ресурсы
Бывало ли у вас такое, что, например, партнеры по бизнесу прислали какую-то документацию или проект договора о сотрудничестве в виде файла графического формата (обычной картинки или документа PDF)? По всей видимости, с этим сталкивались, если не все, то очень многие. А ведь документ вам бывает нужно срочно изменить, а чаще всего это касается редактирования текстовой части, которая может содержаться в исходном файле. Как распознать текст с картинки, чтобы затратить на это минимум времени и избежать возможного появления всевозможных ошибок и опечаток? Об этом и многом другом далее и пойдет речь. Способов «вытаскивания» текста из файлов графических типов или универсального формата PDF на сегодняшний день существует много, однако при рассмотрении некоторых из них будем отталкиваться от наиболее интересных, простых и понятных любому пользователю методов.
Как распознать текст с картинки в Word?
Начать стоит с одного из самых простых методов, который подойдет всем без исключения пользователям. Если речь идет о том, чтобы «вытащить» текст из PDF-документа, а затем отредактировать его и сохранить в «родном» формате текстового редактора Word, далеко ходить не нужно, поскольку все последние версии этого приложения, начиная с «Офиса» 2010 года выпуска, поддерживают работу с файлами PDF и позволяют их редактировать точно так же просто, как если бы это был самый обычный документ Word.
Чтобы в «Ворде» распознать текст с картинки формата PDF, который, если кто не знает, относится именно к графическим типам файлов, достаточно задать открытие документа, а в типе файла выбрать именно формат PDF. После этого текст можно будет и отредактировать, и сохранить повторно в виде «родного» формата редактора, выбрав в том же поле нужный тип (например, DOC или DOCX).
Дополнительные инструменты для Office 2003
Если же проблема состоит в том, как распознать текст с картинки в редакторе, входящем в состав офисного пакета, скажем, 2003 года, в котором формат PDF не поддерживается, то и в этом случае ничего сложного нет.
В довесок к самому текстовому редактору дополнительно можно установить инструмент в виде интегрируемого в Word расширения под названием File Format Converters, который добавит возможностей редактору в том плане, что он сможет работать и с файлами PDF, и с документами обновленных форматов вроде DOCX.
Как распознать текст с картинки в PDF?
Еще один способ извлечения текста непосредственно из графического объекта в PDF-формате состоит в том, чтобы воспользоваться любым из известных редакторов, рассчитанных на работу с такими документами. Одним из наиболее универсальных и практичных приложений можно назвать небезызвестную программу Reader от Adobe. Обратите внимание, что в данном случае речь идет именно о приложении «Ридер», а не об аналогичном просмотрщике «Акробат», который поддерживает только чтение документов (просмотр без возможности редактирования).
В самой программе вам нужно будет просто выделить нужный фрагмент текста, скопировать его в буфер обмена, а затем вставить в документ Word и сохранить в нужном конечном формате.
Использование приложения OneNote
Если разбираться в тонкостях того, как распознать текст с картинки без использования вышеописанных приложений, можно посоветовать воспользоваться еще одним уникальным апплетом, входящим в состав последних модификаций и сборок самих офисных пакетов, под названием OneNote, о возможностях которого многие пользователи в большинстве своем или забывают, или не знают вовсе. В программе потребуется для удобства работы всего лишь создать пустой документ, используя меню вставки поместить в него изображение с текстом из графического файла (любого формата), а затем настроить язык распознавания.
После этого останется только скопировать текст в буфер обмена, для чего используется специальный пункт «Копировать текст с картинки», после чего его можно будет вставить из буфера в любую другую программу.
Примечание: если вопросы касаются того, как с картинки распознать китайский текст или содержимое, представленное на любом другом неподдерживаемом для отображения языке, вам потребуется установить дополнительный языковой пакет, загрузив его, например, из официального источника Microsoft и интернете.
Система распознавания ABBYY Finereader
Естественно, если речь идет исключительно о том, как распознать текст с картинки в графических форматах, лучше всего применять для этого специализированные OCR-системы. Одной из самых мощных и популярных является программа ABBYY Finereader, а также ее онлайн-аналог в виде официального интернет-портала.
Это приложение работает по типу виртуального сканера, в котором нужно всего лишь задать направление распознавания, а иногда может потребоваться указать язык исходного документа (это относится к устаревшим версиям пакета). Когда сканирование текста на том же печатном листе или в графическом файле будет закончено, он будет автоматически перенаправлен, например, в Word или в любой другой офисный редактор.
Конвертеры форматов
Пока это были самые простые приложения, позволяющие распознать текст с картинки. Программы для выполнения таких действий включают в себя и еще одну категорию ПО, называемого конвертерами. Они интересны тем, что выполнять именно распознавание текстового содержимого графического файла в них не нужно. Суть состоит в том, чтобы переконвертировать исходный графический формат в выбранный текстовый, после чего преобразованный файл и можно будет открыть в нужном редакторе. Кроме того, очень часто именно такие приложения оказываются максимально эффективными, когда вам требуется обработать несколько десятков однотипных документов. Это называется пакетным режимом. Что же до самих программ, их в том же интернете можно найти огромное количество.
Среди наиболее востребованных приложений можно отметить утилиты для преобразования PDF-файлов в любые другие форматы, конвертеры PDF или JPG в Word, универсальные преобразователи любого типа графики в текстовые файлы и т. д.
Онлайн-сервисы: нюансы использования и возможные ограничения
Наконец, если ни одно из предложенных решений вам не подходит, заниматься преобразованиями вручную просто лень или нет времени, пожалуйста, в интернете представлено огромное количество ресурсов, на которых все эти операции будут выполнены без вашего прямого участия. От вас потребуется только загрузить исходный графический файл, дождаться окончания извлечения текста и скачать готовый текстовый файл на собственный компьютер (или даже просто скопировать текст из окна с результатом). Правда, неудобство некоторых таких сервисов состоит только в том, что зачастую могут устанавливаться ограничения по количеству одновременно загружаемых для обработки файлов и лимиты, касающиеся их размера, не говоря уже и о том, что некоторые сервисы являются отнюдь не бесплатными. Зато многие из таких ресурсов определяют используемый в тексте язык автоматически, что избавляет вас от дополнительных ненужных действий по переводу.