Как да разпознаем PDF файл онлайн

Anonim

Как да разпознаем PDF файл онлайн

Не винаги можете да премахнете текста от PDF файл, използвайки метода на обичайната копие. Често, на страниците на тези документи са сканирани съдържанието на техните възможности за хартия. За да се превърне тези файлове, за да напълно редактиране на текст на данни, специални програми се използват с разпознаване на функцията Optical Character Recognition (OCR).

Подобни решения са много сложни в продажбите и поради това, че има значителен пари. Ако необходимостта от признаване на текст с PDF можете да възникнат редовно, това ще бъде доста препоръчително да се закупи подходяща програма. За редки случаи, един от най-добрите онлайн услуги със сходни характеристики ще бъде по-логично.

Как да разпознаем текст с PDF онлайн

Разбира се, един набор от функции за разпознаване на онлайн услуги, в сравнение с пълноценни настолни решения, е по-ограничен. Но е възможно да се работи с такива ресурси или напълно безплатно или срещу символична такса. Основното нещо е, че с нейна основна задача, а именно с признаването на текста, съответните уеб приложенията ще се справят, както добре.

Метод 1: ABBYY FineReader Online

Компанията услуга разработчик е един от лидерите в областта на оптично разпознаване на документи. ABBYY FineReader за Windows и Mac е мощно решение за конвертиране на PDF към текст и по-нататъшна работа с него.

Уеб аналог на програмата, разбира се, е по-малък, за да го по функционалност. Независимо от това, услугата може да разпознае текста от сканиране и фотографии на повече от 190 езика. С подкрепата на PDF файл конвертиране на Word, Excel документи и т.н.

Онлайн обслужване на ABBYY FineReader Online

  1. Преди да започнете работа с инструмент, да си създадете профил в сайта или влезте с профила си в Facebook, Google или Microsoft.

    Регистрация в онлайн услугата ABBYY FineReader Online

    За да преминете към прозореца на разрешение, кликнете върху бутона "Вход" в горния панел на менюто.

  2. До влизане в системата, импортиране на желания PDF документа в FineReader, с помощта на бутона "Свали файла".

    Текст признание от документ PDF в онлайн услугата ABBYY FineReader ONLINE

    След това кликнете върху "Select Номера на страници" и посочете желаната разликата да разпознава текст.

  3. След това изберете настоящето езици в документа, файлов формат изход и кликнете върху бутона "Разпознаване".

    Започнете на текст от PDF документ признаване в ABBYY FineReader Online

  4. След обработка, чиято продължителност зависи изцяло от размера на документ, можете да изтеглите готов файл с текстови данни, като просто като кликнете върху името му.

    Изтеглянето на готовия документ от онлайн услугата ABBYY FineReader Online

    Или да я експортирате в един от наличните услуги в облака.

Услугата е може би най-точни алгоритми за разпознаване на текст от изображения и PDF файлове. Но, за съжаление, свободната си употреба е ограничена до пет страници, обработени на месец. За да работите с повече обемни документи, ще трябва да си купите годишен абонамент.

Въпреки това, ако функцията OCR е необходима доста рядко, ABBYY FineReader Online е една отлична възможност да извлечете текст от малки PDF файлове.

Метод 2: БЕЗПЛАТНО онлайн OCR

Лесно и удобно текст дигитализиране на текст. Без да е необходимо да се регистрирате, ресурсът ви позволява да разпознае 15 пълни PDF страници на час. Безплатни онлайн OCR напълно работи с документи на 46 езика и без разрешение поддържа три текстови износ - DOCX, XLSX и TXT.

При регистрацията, потребителят получава възможност да обработва документи от много страници, обаче, свободната броят на тези страници е ограничено до 50 единици.

Онлайн обслужване Безплатни онлайн OCR

  1. За разпознаване на текст от PDF като "гост", без разрешение на ресурса, използвайте подходящата форма на главната страница на сайта.

    PDF признаване в онлайн Безплатни онлайн OCR

    Изберете желания документ с помощта на бутона на файла, посочете основния език на текста, изходния формат, след това изчакайте за файла, за да изтеглите и натиснете Convert.

  2. В края на процеса на цифровизация, кликнете върху "Изтегляне на изходния файл", за да спаси готовия документ с текста на компютъра.

    резултати Зарежда разпознаване на текст с PDF от Безплатни онлайн OCR онлайн услуга

За оторизираните потребители, последователността от действия е малко по-различна.

  1. Използвайте "регистър" или бутона "Вход" в панела отгоре меню за, съответно, да създадете профил в Безплатни онлайн OCR или да отидете до него.

    Създаването на профил в онлайн Безплатни онлайн OCR

  2. След разрешение на арматурното признаване, задържане на "Ctrl" ключ, изберете до два езика на изходния документ от предложения списък.

    Определяне на езиците на изходния документ за разпознаване на текст в свободна Online OCR

  3. Посочете допълнителни параметри за извличане на текст от PDF и щракнете върху бутона Избор на файл, за да изтеглите документа до услугата.

    признаване Старт на PDF-документ в онлайн услугата Безплатни онлайн OCR

    След това, за да продължите с признание, натиснете "Convert".

  4. В края на обработката на документа, кликнете върху линка, наречен на изходния файл в съответната колона.

    Изтеглянето на готовия DOCX файл от онлайн услугата Безплатни онлайн OCR

    В резултат на признаване незабавно ще бъдат запазени в паметта на компютъра ви.

Ако е необходимо, отстранете текст от малък PDF документ може да бъде безопасно да се прибегне до използването на инструмента е описано по-горе. За работа с обемисти файлове, ще трябва да си закупите допълнителни знаци в БЕЗПЛАТНО онлайн OCR или прибягват до друго решение.

Метод 3: NewOCr

Напълно безплатно OCR-услуга, която ви помага да извлечете текст от почти всяко графичен и електронни документи, като DjVu и PDF. Ресурсът не налага ограничения върху размера и броя на разпознаваем файл не изисква регистрация и предлага широка гама от свързани функции.

NewOCR поддържа 106 езика и е в състояние да се справят правилно дори ниски сканира за качество на документи. Възможно е да се избира ръчно района, за да се признае страница текстов файл.

Онлайн услугата NewOCR

  1. Така че, да се работи с този ресурс може веднага, без да се налага да извършват ненужни действия.

    Изтегляне на PDF-файл за признаване в онлайн услугата NewOCR

    Право на главната страница съдържа форма за внос на документа в сайта. За да качите файл, за да NewOCR, моля използвайте бутона "Избор на файл" в раздела «Избор на файл". След това, в «Език за разпознаване (и)", посочва един или повече езици на оригиналния документ, а след това натиснете бутона «Качи + OCR».

  2. Попитайте предпочитаните настройки OCR, изберете желаната страница, за да извлечете текст и кликнете върху бутона «OCR».

    Конфигуриране и работи OCR към PDF онлайн услуга NewOCR

  3. Превъртете надолу малко по-ниски и за «Изтегли» бутон поглед.

    Изтегляне NewOCR възстановен в текста на компютъра

    Кликнете върху него и списъка падащото, изберете желания формат документ за изтегляне. Готовият файл с добитите текстът ще бъде изтеглена на вашия компютър.

Инструмент удобен и доста качествено признае всички герои. Въпреки това, обработката на всяка страница на PDF-документ, внесени за да се яви самостоятелно и я показва в отделен файл. Можете, разбира се, просто да копирате резултатите в клипборда, и да ги комбинирате с други хора.

Въпреки това, като се има предвид по-горе уговорка, големи суми на текст с помощта NewOCR много трудно да се извлече. С малки файлове, като се справя услуги "с гръм и трясък".

Метод 4: OCR.Space

Лесна и интуитивна ресурс за дигитализиране на текст, може да разпознае PDF-документи и показва резултатите в TXT файл. Няма ограничения за броя на страниците не е предвидено. само за ограничаване - размер вход документ не трябва да надвишава 5 MB.

Онлайн OCR.Space услуга

  1. За да се регистрирате за работа с инструмента не е необходимо.

    Импортиране на PDF-файл на онлайн услугата OCR.Space

    Просто кликнете върху линка по-горе и да изтеглите PDF-документ на сайта от компютър с помощта на бутона "Избор на файл" или от мрежата - връзката.

  2. В падащия «Избор на OCR език» списък, изберете внесени език документ.

    Стартиране на процеса на признаване на PDF-документ в онлайн услугата OCR.Space

    След това стартирате процеса на OCR, като кликнете върху бутона «Начало OCR!».

  3. Когато обработката на файла е пълна проверка на резултата в «OCR'ed Резултати» поле и кликнете върху «Изтегли», готови за изтегляне TXT-документ.

    Изтегляне на резултата от PDF файла разпознаване от OCR.Space Online Service

Ако просто трябва да извлечете текст от PDF и в същото време крайното форматиране не е важно изобщо, OCR.Space е добър избор. Единственият, документът трябва да бъде "едноговоряне", тъй като признаването на два или повече езика едновременно в услугата не е предоставена.

Прочетете също: FineReader Безплатни аналози

Оценката на онлайн инструментите, представени в статията, трябва да се отбележи, че FineReader онлайн от ABBYY е най-точен и качествено с функцията OCR. Ако сте важни за вас максималната деформация на разпознаването на текста, най-добре е да разгледате конкретно тази опция. Но те най-вероятно ще плащат за него.

Ако се нуждаете от цифровизация на малки документи и сте готови да коригирате правилно грешките на услугата, препоръчително е да използвате NewOCH, OCR.Space или безплатно онлайн OCR.

Прочетете още