Како да препознаете PDF датотека онлајн

Anonim

Како да препознаете PDF датотека онлајн

Не можете секогаш да го отстраните текстот од PDF датотеката со користење на вообичаениот метод за копирање. Често, страниците на таквите документи се скенираните содржини на нивните опции за хартија. За да ги конвертирате таквите датотеки за целосно уредување на текстуални податоци, специјалните програми се користат со функцијата за препознавање на оптички знаци (OCR).

Таквите одлуки се многу сложени во продажбата и, според тоа, постојат значителни пари. Ако потребата за препознавање на текст со PDF автоматски ќе се појави, тоа ќе биде сосема препорачливо да се купи соодветна програма. За ретки случаи, една од достапните онлајн услуги со слични карактеристики ќе биде логично.

Како да го препознаете текстот со PDF онлајн

Се разбира, збир на функции на OCR онлајн услуги, во споредба со полноправни десктоп решенија, е повеќе ограничен. Но, можно е да се работи со такви ресурси или целосно бесплатно или за симболична такса. Главната работа е тоа што со својата главна задача, имено, со признавање на текстот, соодветните веб апликации ќе се справат, исто така.

Метод 1: abbyy finereader онлајн

Компанијата за инвестирање на услуги е еден од лидерите во областа на оптичкото признавање на документите. Abbyy finereader за Windows и Mac е моќно решение за конвертирање на PDF во текст и понатамошно работење со него.

Веб аналог на програмата, се разбира, е инфериорен во однос на тоа со функционалност. Сепак, услугата може да го препознае текстот од скенирање и фотографии на повеќе од 190 јазици. Поддржана PDF датотека конверзија на Word, Excel документи, итн.

Онлајн служба abbyy fineraeader онлајн

  1. Пред да почнете да работите со алатка, креирајте сметка на страницата или да се најавите со сметката на Фејсбук, Google или Microsoft.

    Регистрација во онлајн услуга abbyy finereader онлајн

    За да отидете на прозорецот за авторизација, кликнете на копчето "Најави" во горниот дел од менито.

  2. Со најавување, увезете го саканиот PDF документ во FinEneader, користејќи го копчето "Преземи датотеки".

    Препознавање со текст од PDF-документот во онлајн услугата abbyy finereader онлајн

    Потоа кликнете на "Избери броеви на страници" и наведете го саканиот јаз за препознавање на текст.

  3. Следно, одберете ги јазиците присутни во документот, формат на резултатот од исходот и кликнете на копчето "Признајте".

    Започнете со препознавање текст од PDF документ во Abbyy Finereader Online

  4. По обработката, чие времетраењето зависи целосно од износот на документот, можете да преземете готови датотека со податоци за текст со едноставно со кликнување на неговото име.

    Преземање на готовиот документ од онлајн услугата abbyy finereader онлајн

    Или извоз на еден од достапните облак услуги.

Услугата е веројатно најточни алгоритми за препознавање текст на слики и PDF датотеки. Но, за жал, неговата слободна употреба е ограничена на пет обработени страници месечно. За работа со повеќе обемни документи, ќе мора да купите годишна претплата.

Меѓутоа, ако функцијата OCR е потребна доста ретко, Abbyy Finereader Online е одлична опција за извлекување на текст од мали PDF датотеки.

Метод 2: бесплатен онлајн OCR

Едноставен и удобен текст дигитализиран текст. Без потреба да се регистрирате, ресурсот ви овозможува да препознаете 15 полни PDF страници на час. Бесплатно онлајн OCR целосно работи со документи на 46 јазици и без овластување поддржува три текст извоз - DOCX, XLSX и TXT.

Кога се регистрирате, корисникот добива можност да ги обработува документите со повеќе страници, сепак, слободниот број на овие страници е ограничен на 50 единици.

Онлајн служба бесплатно онлајн OCR

  1. За да го препознаете текстот од PDF како "гостин", без овластување на ресурсот, користете ја соодветната форма на главната страница на страницата.

    PDF признавање во онлајн бесплатни онлајн OCR

    Изберете го саканиот документ користејќи го копчето за датотека, наведете го главниот јазик на текстот, излезниот формат, а потоа почекајте датотеката за преземање и кликнете Конвертирајте го.

  2. На крајот од процесот на дигитализација, кликнете "Преземи излез датотека" за да го зачувате готовиот документ со текстот на компјутерот.

    Вчитување на текстуално препознавање резултати со PDF од бесплатна онлајн OCR онлајн услуга

За овластените корисници, редоследот на активностите е поинаква.

  1. Користете го копчето "Регистрирај се" или "најава" во горниот дел од менито, соодветно, креирајте бесплатна онлајн OCR сметка или одете на него.

    Креирање на сметка во онлајн бесплатни онлајн OCR

  2. По овластувањето во советот за препознавање, држејќи го копчето "CTRL", одберете до два јазика на изворниот документ од предложената листа.

    Дефиниција на јазиците на изворниот документ за препознавање на текст во бесплатни онлајн OCR

  3. Наведете дополнителни параметри за екстракција на текст од PDF и кликнете на копчето Select File за да го преземете документот на услугата.

    Започнете го препознавањето на PDF документ во онлајн услуга бесплатно онлајн OCR

    Потоа, за да продолжите со препознавање, кликнете "Конвертирај".

  4. На крајот од обработката на документот, кликнете на врската наречена излезна датотека во соодветната колона.

    Преземање на готовиот Docx датотека од бесплатна онлајн OCR онлајн услуга

    Резултатот од признавањето веднаш ќе биде зачуван во меморијата на вашиот компјутер.

Доколку е потребно, отстранете го текстот од мал PDF документ може да биде безбеден за прибегнување кон употребата на алатката опишана погоре. За да работите со обемни датотеки, ќе мора да купите дополнителни знаци во бесплатни онлајн OCR или прибегнување кон друго решение.

Метод 3: Њубор

Целосно бесплатна OCR услуга која ви овозможува да извлечете текст од речиси сите графички и електронски документи како DJVU и PDF. Ресурсот не наметнува ограничувања за големината и бројот на препознатливи датотеки, не бара регистрација и нуди широк спектар на сродни функции.

NewCorock поддржува 106 јазици и правилно може да обработува дури и со низок квалитет на документи. Можно е рачно да се избере областа за препознавање текст на страната со датотеки.

Онлајн сервис newocr.

  1. Значи, можете веднаш да започнете со ресурс, без потреба да вршите дополнителни дејства.

    Вчитување на PDF датотеката за препознавање на онлајн услуга Newcrect

    Право на главната страница постои форма за увоз на документ на страницата. За да ја преземете датотеката во Њуборко, користете го копчето Select File во изборот на вашата датотека. Потоа, во полето "Јазикот за препознавање", наведете еден или повеќе изворни јазици на документите, а потоа кликнете "Додај + OCR".

  2. Наведете ги прилагодените прилагодувања за препознавање, одберете ја саканата страница за да го превземете текстот и кликнете на копчето OCR.

    Поставување и започнување на препознавање текст со PDF во онлајн сервис Newcrect

  3. Скролувајте надолу по страницата малку пониска и пронајдете го копчето "Преземи".

    Преземи научив во Њуборк текст на компјутер

    Кликнете на неа и во паѓачката листа, одберете го саканиот формат на документот за преземање. После тоа, завршената датотека со извлечен текст ќе биде преземена на вашиот компјутер.

Алатката е погодна и доста ги препознава сите знаци. Сепак, обработката на секоја страница на увезениот PDF документ мора да биде лансирана независно и е прикажана во посебна датотека. Се разбира, можете веднаш да ги копирате резултатите од препознавањето во таблата со исечоци и да ги комбинирате со други.

Сепак, со оглед на горенаведената нијанса, големи количини на текст користејќи Њуборк за извлекување многу тешко. Со мали датотеки, услугата се справува со "со тресок".

Метод 4: OCR.SPACE

Едноставен и разбирлив ресурс за текстуална дигитализација ви овозможува да ги препознаете PDF документите и да го изнесете резултатот во датотеката TXT. Не се обезбедени ограничувања во бројот на страници. Единствено ограничување е големината на влезниот документ не треба да надминува 5 мегабајти.

Онлајн сервис OCR.Space.

  1. Вие не треба да се регистрирате за да работите со алатката.

    Увоз PDF датотека во онлајн OCR.Space услуга

    Само кликнете на врската погоре и преземете го PDF-документот на страницата од компјутерот користејќи го копчето "Избери датотека" или од мрежата со референца.

  2. Во опаѓачката листа на OCR јазик, одберете го јазикот на увезениот документ.

    Вклучување на PDF процесот на препознавање на документи во OCR.Space

    Потоа извршете го процесот на препознавање текст со кликнување на копчето "Start OCR!".

  3. На крајот од обработката на датотеки, видете го резултатот во полето за резултат на OCR и кликнете "Преземи" за да го преземете готовиот документ Txt.

    Преземање на резултатот од PDF-датотеката препознавање на OCR.Space Online

Ако само треба да извлечете текст од PDF и во исто време конечното форматирање што воопшто не е важно, OCR.Space е добар избор. Единствениот, документот мора да биде "едногодишен", бидејќи признавањето на два или повеќе јазици истовремено во услугата не е обезбедено.

Прочитајте исто така: финалиментарни аналози

Оценувањето на онлајн инструментите презентирани во статијата треба да се забележи дека finereader Online од Abbyy е најточна и квалитативно со функцијата OCR. Ако сте важни за вас максимална деформитет на препознавањето на текстот, најдобро е да се разгледа конкретно оваа опција. Но, тие најверојатно ќе го платат за него.

Ако ви треба дигитализација на мали документи и сте подготвени правилно да ги корегирате грешките на услугите, препорачливо е да користите NewCrons, OCR.SPACE или бесплатен онлајн OCR.

Прочитај повеќе