Отсканированный документ перевести в формат word онлайн. Как отсканированный документ перевести в формат Word

Для Андроид 17.10.2019
Для Андроид

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке .

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.

Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования нам, конечно же, потребуется сканер. Его не обязательно покупать. Можно, например, на время взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканнер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла.jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование :

– запускаем драйвер сканера: Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

– открываем крышку сканера и кладем книгу, журнал или их копию текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Здесь очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом;

– выполним необходимые установки в драйвере сканнера. Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Предлагаю посмотреть на скриншот установок моего принтера:


Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый” , ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д . Выходной размер изображения – обязательно “А4” . Теперь можно смело жать на кнопку “Сканировать” . Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этап распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader . Скачайте программу по этой ссылке (32Мб) . Пароль к архиву – сайт . Предложенная мной версия не требует установки (portable). В папке с программой будет множество разных файлов, но Вам нужен только один – FineReader.exe . Двойной клик на этом файле запустит программу на Вашем компьютере.

Эта версия программы достаточно старая. Все скриншоты ниже я делал используя именно её. Если эта версия FineReader у вас не запускается - выберите более новую .

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть .

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет ) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно . В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе .

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК . Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

Как отсканировать документ и распознать его в MS Word

Программы для распознавания текста позволяют конвертировать сфотографированные или отсканированные документы непосредственно в предложения.

Дело в том, что текст на изображении представлен в виде растра, набора точек. Упомянутый софт осуществляет превращение набора точек в полноценный текст, доступный для редактирования и сохранения.

Распознавание букв призвано оптимизировать процесс оцифровки бумажных печатных или рукописных книг, документов.

Такой метод оцифровки на порядки превосходит скорость ручного набора с изображения. Широко применяется при оцифровке библиотек и архивов. Далее рассмотрим пятерку лучших представителей семейства подобных программ.

ABBYY FineReader 10

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

  • пробная версия на 15 дней.

OCR CuneiForm

Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Интересно! CuneiForm распознает блоки текста, графические изображения и даже различные таблицы. Более того, считыванию поддаются даже неразлинованные таблицы.

Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства:

  • бесплатное распространение;
  • использование словарей для проверки правильности текста;
  • сканирование текста с ксерокопий плохого качества.

Недостатки:

  • относительно небольшая точность;
  • небольшое количество поддерживаемых языков.

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.

SimpleOCR

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

  • полное отсутствие русского языка.

Freemore OCR

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

Извлечь текст из PDF-файла методом обычного копирования можно далеко не всегда. Часто страницы подобных документов представляют собой отсканированное содержимое их бумажных вариантов. Для преобразования таких файлов в полностью редактируемые текстовые данные используются специальные программы с функцией Optical Character Recognition (OCR).

Такие решения являются весьма сложными в реализации и, следовательно, стоят немалых денег. Если потребность в распознавании текста с PDF у вас возникает регулярно, вполне целесообразно будет приобрести соответствующую программу. Для редких же случаев более логичным будет воспользоваться одним из доступных онлайн-сервисов с подобными функциями.

Конечно, набор возможностей онлайн-сервисов OCR, в сравнении с полноценными десктопными решениями, более ограничен. Но и работать с такими ресурсами можно либо же совсем бесплатно, либо за символическую плату. Главное, что с основной своей задачей, а именно с распознаванием текста, соответствующие веб-приложения справляются так же хорошо.

Способ 1: ABBYY FineReader Online

Компания-разработчик сервиса — одна из лидеров в области оптического распознавания документов. для Windows и Mac является мощным решением для преобразования PDF в текст и дальнейшей работы с ним.

Веб-аналог программы, конечно же, уступает ей по функционалу. Тем не менее сервис умеет распознавать текст со сканов и фотографий на более чем 190 языках. Поддерживается преобразование PDF-файлов в документы , и т.п.


Сервис отличается, вероятно, наиболее точными алгоритмами распознавания текста на изображениях и PDF-файлах. Но, к сожалению, его бесплатное использование ограничено пятью обрабатываемыми страницами в месяц. Чтобы работать с более объемными документами, придется купить годовую подписку.

Тем не менее, если функция OCR нужна совсем уж редко, ABBYY FineReader Online — отличный вариант для извлечения текста из небольших PDF-файлов.

Способ 2: Free Online OCR

Простой и удобный сервис для оцифровки текста. Без необходимости регистрации ресурс позволяет распознавать 15 полных PDF-страниц в час. Free Online OCR полноценно работает с документами на 46 языках и без авторизации поддерживает три формата экспорта текста — DOCX, XLSX и TXT.

При регистрации пользователь получает возможность обрабатывать многостраничные документы, однако бесплатное количество этих самых страниц ограничено 50 единицами.



При необходимости извлечь текст из небольшого PDF-документа можно смело прибегать к использованию вышеописанного инструмента. Для работы же с объемными файлами придется купить дополнительные символы во Free Online OCR либо же прибегнуть к другому решению.

Способ 3: NewOCR

Полностью бесплатный OCR-сервис, позволяющий извлекать текст практически из любых графических и электронных документов вроде DjVu и PDF. Ресурс не накладывает ограничений на размер и количество распознаваемых файлов, не требует регистрации и предлагает широкий набор сопутствующих функций.

NewOCR поддерживает 106 языков и умеет корректно обрабатывать даже низкокачественные сканы документов. Есть возможность вручную выбирать область для распознавания текста на странице файла.


Инструмент удобный и достаточно качественно распознает все символы. Впрочем, обработку каждой страницы импортированного PDF-документа нужно запускать самостоятельно и выводится она в отдельный файл. Можно, конечно, сразу копировать результаты распознавания в буфер обмена и объединять их с другими.

Тем не менее, учитывая вышеописанный нюанс, большие объемы текста с помощью NewOCR извлекать весьма затруднительно. С малыми же файлами сервис справляется «на ура».

Способ 4: OCR.Space

Простой и понятный ресурс для оцифровки текста, позволяет распознавать PDF-документы и выводить результат в TXT-файл. Никаких лимитов по количеству страниц не предусмотрено. Единственное ограничение — размер входного документа не должен превышать 5 мегабайт.


Если вам нужно просто извлечь текст из PDF и при этом финальное его форматирование совсем не важно, OCR.Space — хороший выбор. Единственное, документ должен быть «одноязычным», так как распознавание двух и более языков одновременно в сервисе не предусмотрено.

Вопрос от пользователя

Добрый день.

Подскажите пожалуйста. У меня есть один файл формата PDF, и мне нужно его отредактировать (поменять часть текста, поставить заголовки и выделения). Думаю, что лучше всего такую операцию провести в WORD.

Как конвертировать этот файл в формат DOCX (с которым работает WORD)? Пробовала несколько сервисов, но некоторые выдают ошибку, другие - переносят текст, но теряют картинки. Можно ли сделать лучше?

Марина Иванова (Нижний Новгород)

Доброго дня!

Да, в офисной работе время от времени приходится сталкиваться с такой задачей. В некоторых случаях, она решается довольно легко, в других - всё очень непросто ☺.

Дело в том, что PDF файлы могут быть разными:

  1. в форме картинок : когда каждая страничка представляет из себя фото/картинку, т.е. текста там нет в принципе. Самый сложный вариант для работы, т.к. перевести это все в текст - это все равно что работать со сканированным листом (у кого есть сканер - тот поймет ☺). В этом случае целесообразно пользоваться спец. программами;
  2. в форме текста : в файле есть текст, который сжат в формат PDF и защищен (не защищен) от редактирования (с этим типом, как правило, работать легче). В этом случае сгодятся и онлайн-сервисы, и программы.

В статье рассмотрю несколько способов преобразования PDF в WORD. Думаю, что из них каждый для себя сможет найти самый подходящий, и выполнит сию задачу ☺.

Программами

Microsoft Word

В новых версиях Word (по крайней мере в 2016) есть специальный инструмент по преобразованию PDF файлов. Причем, от вас ничего ненужно - достаточно открыть какую-нибудь "пдф-ку" и согласиться на преобразование. Через пару минут - получите результат.

И, кстати, данная функция в Word работает весьма неплохо (причем, с любыми типами PDF файлов). Именно поэтому, рекомендую попробовать сей способ в первую очередь.

Как пользоваться : сначала откройте Word, затем нажмите "файл/открыть" и выберите нужный вам файл.

На вопрос о преобразование - просто согласитесь. Через некоторое время увидите свой файл в форме текста.

Плюсы : быстро; не нужно никаких телодвижений от пользователя; приемлемый результат.

Минусы : программа платная; часть форматирования документа может потеряться; далеко не все картинки будут перенесены; на процесс преобразования никак нельзя повлиять - всё идет в авто-режиме.

Примечание!

Вместо Word и Excel можно использовать другие бесплатные аналоги с похожим функционалом. О них я рассказывал в этой статье:

ABBY Fine Reader

Ограничения в пробной версии : 100 страниц для распознавания; софт работает в течении 30 дней после установки.

А вот эта программа одна из самых универсальных - ей можно "скормить" любой файл PDF, картинку, фото, скан. Работает она по следующему принципу: выделяются блоки текста, картинок, таблиц (есть авто-режим, а есть ручной), а затем распознает с этих блоков текст. На выходе вы получаете обычный документ Word.

Кстати, последние версии программы отличаются направленностью на начинающего пользователя - пользоваться программой очень просто. В первом приветственном окне выберите "Изображение или PDF-файл в Microsoft Word" (см. скрин ниже).

Fine Reader - популярные задачи, вынесенные в стартовое окно приветствия

Далее программа автоматически разобьет ваш документ по страничкам, и на каждой страничке сама выделит все блоки и распознает их. Вам останется подправить ошибки и сохранить документ в формат DOCX (кстати, Fine Reader может сохранить и в другие форматы: HTML, TXT, DOC, и пр.).

Fine Reader - распознавание текста и картинок в PDF файле

Плюсы : можно перевести любую картинку или PDF файл в текстовый формат; лучшие алгоритмы распознавания; есть опции для проверки распознанного текста; можно работать даже с самыми безнадежными файлами, от которых отказались все остальные сервисы и программы.

Минусы : программа платная; нужно вручную указывать блоки на каждой из страничек.

Readiris Pro

Ограничение пробной версии : 10 дней использования или обработка 100 страниц.

Эта программа некоторый конкурент Fine Reader. Она поможет сканировать документ с принтера (даже если у вас нет драйверов на него!), а потом распознать информацию со скана и сохранить ее в Word (в этой статье нас интересует вторая часть, а именно распознавание ☺).

Кстати, благодаря очень тесной интеграции с Word - программа способна распознать математические формулы, различные не стандартные символы, иероглифы и т.д.

Плюсы : распознавание разных языков (английский, русский и пр.); множество форматов для сохранения; неплохие алгоритмы; системные требования ниже, чем у других программ аналогов.

Минусы : платная; встречаются ошибки и необходима ручная обработка.

Free PDF to Word Converter

Очень простая программа для быстрой конвертации файлов PDF в DOC. Программа полностью бесплатна, и при преобразовании - старается сохранить полностью исходное форматирование (чего многим аналогам так не хватает).

Несмотря на то, что в программе нет русского, разобраться со всем достаточно просто: в первом окне указываете PDF файлы (Select File - т.е. выбрать файлы); во втором - формат для сохранения (например, DOC); в третьем - папку, куда будут сохранены преобразованные документы (по умолчанию, используется "Мои документы").

В общем-то, в целом хороший и удобный инструмент для преобразования относительно несложных файлов.

Онлайн-сервисами

Small PDF

Бесплатно

Smallpdf.com - бесплатное решение всех PDF проблем

Отличный и бесплатный сервис для преобразования и работы с PDF файлами. Здесь есть все, что может пригодиться: сжатие, конвертирование между JPG, Word, PPT, объединение PDF, поворачивание, редактирование и пр.!

Преимущества:

  1. качественное и быстрое преобразование, редактирование;
  2. простой и удобный интерфейс: разберется даже совсем начинающий пользователь;
  3. доступно на всех платформах: Windows, Android, Linux и пр.;
  4. работа с сервисом бесплатна.

Недостатки:

  1. не работает с некоторыми типами файлов PDF (там, где нужно проводить распознавание картинок).

Конвертер PDF

Стоимость: около 9$ в месяц

Этот сервис позволяет бесплатно обрабатывать только две странички (за остальное придется доплатить). Зато сервис позволяет конвертировать PDF файл в самые различные форматы: Word, Excel, Power Point, в картинки и т.д. Также у него используются отличные от аналогов алгоритмы (позволяют получить качество обработки файла на порядок выше, чем у аналогов). Собственно, благодаря этой функциональности и алгоритмам, я и добавил его в обзор...

Кстати, по первым двум страничкам сможете сделать вывод, стоит ли покупать подписку на сервис (стоимость около 9$ за месяц работы).

ZamZar

Бесплатно

Многофункциональный онлайн-конвертер, работает с кучей форматов: MP4, MP3, PDF, DOC, MKV, WAV и многие другие. Несмотря на то, что сервис выглядит несколько странным, пользоваться им достаточно просто: т.к. все действия выполняются пошагово (см. на скрин выше: Шаг 1, 2, 3, 4 (Step 1, 2, 3, 4)).

  1. Step 1 (ШАГ 1) - выбор файла.
  2. Step 2 (ШАГ 2) - в какой формат конвертировать.
  3. Step 3 (ШАГ 3) - необходимо указать свою почту (кстати, возможно вам будет статья о том, ).
  4. Step 4 (ШАГ 4) - кнопка для запуска конвертирования.

Особенности:

  1. куча форматов для конверта из одного в другой (в том числе PDF);
  2. возможность пакетной обработки;
  3. очень быстрый алгоритм;
  4. сервис бесплатный;
  5. есть ограничение на размер файла - не более 50 МБ;
  6. результат конверта приходит на почту.

Convertio

Бесплатно

Мощный и бесплатный сервис по онлайн-работе с различными форматами. Что касается PDF - то сервис может конвертировать их в DOC формат (кстати, сервис работает даже со сложными "пдф-ками", с которыми остальные не смогли справиться), сжимать, объединять и пр.

Ограничений на размер файлов и их структуру - не выявлено. Для добавления файла необязательно даже иметь его на диске - достаточно указать URL адрес, а с сервиса уже скачать готовый документ в формате DOC. Очень удобно, рекомендую!

iLOVEPDF

Бесплатно

Похожий на предыдущий сайт: также есть весь функционал для работы с PDF - сжатие, объединение, разбивка, конвертация (в различные форматы). Позволяет быстро преобразовать различные небольшие PDF файлы.

Из минусов : сервис не может обработать файлы, которые состоят из картинок (т.е. "пдф-ки" где нет текста, здесь вы с них ничего не вытащите - сервис вернет вам ошибку, что текста в файле нет).

PDF.io

Бесплатно

Весьма интересный и многофункциональный онлайн-сервис. Позволяет конвертировать PDF в: Excel, Word, JPG, HTML, PNG (и те же самые операции в обратном направлении). Кроме этого, на этом сервисе можно сжимать файлы подобного типа, объединять и разделять страницы. В общем-то, удобный помощник в офисной работе ☺.

Из минусов : сервис справляется не с всеми типами файлов (в частности, про некоторые пишет, что в них нет текста).

Дополнения приветствуются...

При работе с текстовыми документами очень часто возникает необходимость набирать текст с уже распечатанного документа. Подобная работа не очень приятная и отнимает много времени.

К счастью, сейчас существуют программы, которые позволяют значительно упростить и ускорить решения подобных задач. С помощью этих программ можно быстро перевести отсканированный документ в формат текстового редактора Word и избежать рутинной работы по набору текста.

В данной статье мы продемонстрируем, как это делается на примере программы ABBY Finereader 12 Professional. Если у вас нет именно такой программы, то вы можете заменить ее другой версией ABBY Finereader либо совершенно другой программой от другого разработчика. Например, вы можете использовать программы CuneiForm, Free OCR, Readiris Pro или SimpleOCR.

Шаг № 1. Запускаем ABBY Finereader и открываем отсканированный документ.

Первым делом нужно запустить программу ABBY Finereader. После запуска программы нужно нажать на кнопку «Открыть» на панели инструментов.

После этого появится окно для открытия отсканированного документа. Выберите изображение или несколько изображений и нажмите на кнопку «Открыть».

Кроме этого, вместо использования кнопки «Открыть» вы можете просто перетащить отсканированные изображения в программу ABBY Finereader.

Шаг № 2. Ждем пока ABBY Finereader проанализирует выбранные изображение.

Дальше нужно подождать, пока программа ABBY Finereader проанализирует выбранные вами изображение и распознает на них текст. Время необходимое на анализ зависит от количества выбранных изображений и производительности вашего компьютера.

Когда анализ изображений будет завершен, появится сообщение с кнопкой «Закрыть».

Нажмите на кнопку «Закрыть» и переходите к следующему шагу.

Шаг № 3. Переведите отсканированный документ в формат Word.

После завершения анализа, отсканированный документ можно перевести в формат Word. Для этого в программе ABBY Finereader есть кнопка «Сохранить».

После нажатия на кнопку «Сохранить» появится окно для сохранения отсканированного документа в текстовом формате. При этом вы можете выбрать один из множества текстовых форматов (DOC, DOCX, RTF, ODT, PDF, HTM, TXT, XLS, XLSX, PPTX, CSV, FB2, EPUB, DJVU). Для того чтобы без проблем отредактировать документ в редакторе Word выберите формат «Документ Microsoft Word 97-2003 (*.doc)» либо формат «Документ Microsoft Word (*.docx)».

После сохранения документа в формате Word откроется текстовый редактор, и вы сможете начать редактировать отсканированный документ.

Что делать если нет возможности установить программу?

Если у вас нет возможности установить описанные выше программы, то вы можете воспользоваться онлайн аналогами. Наиболее продвинутым онлайн сервисом такого рода является . Данный сервис позволяет перевести отсканированный документ в формат Word, а также в другие популярные текстовые форматы.

К недостаткам ABBY Finereader Online можно отнести то, что данный онлайн сервис требует регистрации и бесплатно обрабатывает только 10 страниц отсканированного текста. Для обработки большего количества страниц нужно покупать подписку, которая стоит от 5 долларов в месяц.



Рекомендуем почитать

Наверх