Извличане на текст от PDF файлове

Докато работите с PDF или Portable Document Format файлове, понякога може да искате да извлечете целия текст от PDF файл . В това ръководство ще покажем как лесно можете да извличате текст от PDF файлове или да конвертирате PDF файлове в текстови файлове в Windows с или без помощта на онлайн инструменти.

Най-лесният и бърз начин за извличане на текст от PDF файлове е да използвате безплатни онлайн услуги. Тези онлайн услуги не изискват допълнителен софтуер, което означава, че можете да си свършите работата, без да се налага да инсталирате допълнителен софтуер на вашия компютър.

Ако по-долу споменатите онлайн услуги не дават желани резултати или бихте искали да извлечете текст от чувствителен, който не искате да качите на отдалечен сървър, можете да проверите безплатния софтуер на Windows, споменат в метод 3 до 5. Също така прочетете нашите 6 начина да компресирате PDF файлове ръководство.

Метод 1 от 6

ExtractPDF

ExtractPDF е безплатна онлайн услуга за пълно извличане на текст и изображения от PDF файлове. Услугата предлага лесно разбираемо оформление. След като отворите страницата ExtractPDF в уеб браузъра си, кликнете върху бутона Преглед, за да изберете вашия PDF файл, кликнете върху бутона за качване, за да качите избрания файл на сървъра на ExtractPDF и да започнете извличането.

След като свършите работата, ще видите опции за изтегляне на текстов контекст, шрифтове и изображения от качения PDF файл. За да изтеглите извлечения текст като .txt файл (за да го отворите в Notepad или Word), преминете към раздела Текст и след това щракнете върху Download result като файл.

Както можете да видите в горната картина, услугата не поддържа файлове, по-големи от 12 MB. Това ограничение не трябва да бъде програма, тъй като повечето PDF файлове ще бъдат под 12 MB.

По време на нашия тест забелязахме, че за някои PDF файлове услугата не дава желания резултат. Ако имате някакви проблеми с тази услуга, проверете следващата.

Метод 2 от 6

Онлайн OCR

Онлайн OCR е онлайн инструмент, който ви помага да извличате текст от PDF файлове с по-малко от 5 MB. Услугата конвертира PDF файловете в редактируеми Microsoft Word (.docx) или текстови (.txt) файлове.

Метод 3 от 6

STDU Viewer

По принцип STDU Viewer е свободен софтуер, предназначен да отваря и преглежда множество файлови формати. В допълнение към това, безплатната версия на STDU Viewer поддържа експортиране на текстово съдържание от PDF файлове.

За да експортирате текстовото съдържание на PDF файл, отворете PDF файла с STDU Viewer, щракнете върху менюто Файл, щракнете върху Експортиране, щракнете върху Текст, изберете местоположение, за да запазите новия текстов файл и след това щракнете върху бутона OK.

Опцията за експортиране ви позволява да извличате текст от една, няколко или всички страници. Размерът на изтегляне на STDU Viewer е под 3 MB. Безплатната версия на STDU Viewer е само за лична и некомерсиална употреба.

Метод 4 от 6

PDF2Text Pilot

PDF2Text Pilot е безплатен софтуер за Windows, за да конвертирате PDF файлове в текстови файлове с едно щракване на мишката. След като инсталирате и стартирате софтуера, просто трябва да изберете PDF файла (ите), който искате да видите като текстови файлове, и след това щракнете върху бутона Преобразуване. Вашите конвертирани файлове ще бъдат готови за няколко секунди.

Силата на PDF2Text Pilot е прост интерфейс и възможност за конвертиране на множество PDF файлове наведнъж.

Метод 5 от 6

A-PDF Текстов екстрактор

A-PDF Text Extractor е друг Windows софтуер, предназначен да извлича текст от PDF файлове. Софтуерът е абсолютно безплатен както за лична, така и за търговска употреба.

След като инсталирате A-PDF Text Extractor (размер на инсталатора е под 1 MB), стартирайте A-PDF Text Extractor. Щракнете върху бутона "Отвори", за да отворите PDF файла, след което щракнете върху бутона Извличане на текст, за да започнете извличането на текст от него.

Метод 6 от 6

PDF Reader

Gaaiho PDF Reader е отличен софтуер, предназначен за работа с PDF файлове. Този свободен софтуер предлага множество функции, които не можете да намерите друг свободен PDF четец софтуер. Една от функциите е възможността за извличане на текст от PDF файлове с лекота.

За да запишете PDF файл като текстов файл, след отваряне на PDF файла в Gaaiho Reader, щракнете върху менюто Файл, щракнете върху Запиши като и след това изберете опцията PDF to Text от падащото меню до Запис като тип.

Какво мислите за тези инструменти? Знаете ли за по-добър безплатен инструмент за една и съща работа? Кажете ни в коментари.