Как вытащить текст из pdf?

Как вытащить текст из pdf?

  1. asad говорит:

    «

    Вытащить текст, из документа в формате pdf, можно двумя способами.

    Первый наиболее простой, используется, когда в документе присутствует уже готовый компьютерный текст.

    В этом случае, можно либо экспортировать текст, в обычный текстовый файл, либо сохранить документ как текст.

    В различных программах, работающих с форматом pdf, эта функция называется по-разному.

    Вытащить текст позволяет как стандартный adobe reader, так и, к примеру, программа STDU Viewer.

    Кстати последняя работает и с другим популярным форматом, djvu.

    Если же в документе pdf, содержатся, лишь изображения страниц с текстом, его необходимо вначале распознать.

    Для этого, на мой взгляд, нет лучшей программы, чем abyy fine reader.

    Именно эта программа лидер среди программ оптического распознавания.

    Вы открываете файл с расширением pdf, в программе, и когда все страницы будут добавлены в пакет, жмете распознать все страницы в меню распознавания.

    И ждете завершения процесса.

    После этого, вам остается лишь сохранить текст, в отдельный файл, и все дела.

    Вот такие способы выделения текста из документа в формате pdf.

Добавить комментарий

Войти с помощью: