Не можете секогаш да го отстраните текстот од PDF датотеката со користење на вообичаениот метод за копирање. Често, страниците на таквите документи се скенираните содржини на нивните опции за хартија. За да ги конвертирате таквите датотеки за целосно уредување на текстуални податоци, специјалните програми се користат со функцијата за препознавање на оптички знаци (OCR).
Таквите одлуки се многу сложени во продажбата и, според тоа, постојат значителни пари. Ако потребата за препознавање на текст со PDF автоматски ќе се појави, тоа ќе биде сосема препорачливо да се купи соодветна програма. За ретки случаи, една од достапните онлајн услуги со слични карактеристики ќе биде логично.
Како да го препознаете текстот со PDF онлајн
Се разбира, збир на функции на OCR онлајн услуги, во споредба со полноправни десктоп решенија, е повеќе ограничен. Но, можно е да се работи со такви ресурси или целосно бесплатно или за симболична такса. Главната работа е тоа што со својата главна задача, имено, со признавање на текстот, соодветните веб апликации ќе се справат, исто така.Метод 1: abbyy finereader онлајн
Компанијата за инвестирање на услуги е еден од лидерите во областа на оптичкото признавање на документите. Abbyy finereader за Windows и Mac е моќно решение за конвертирање на PDF во текст и понатамошно работење со него.
Веб аналог на програмата, се разбира, е инфериорен во однос на тоа со функционалност. Сепак, услугата може да го препознае текстот од скенирање и фотографии на повеќе од 190 јазици. Поддржана PDF датотека конверзија на Word, Excel документи, итн.
Онлајн служба abbyy fineraeader онлајн
- Пред да почнете да работите со алатка, креирајте сметка на страницата или да се најавите со сметката на Фејсбук, Google или Microsoft.
За да отидете на прозорецот за авторизација, кликнете на копчето "Најави" во горниот дел од менито.
- Со најавување, увезете го саканиот PDF документ во FinEneader, користејќи го копчето "Преземи датотеки".
Потоа кликнете на "Избери броеви на страници" и наведете го саканиот јаз за препознавање на текст.
- Следно, одберете ги јазиците присутни во документот, формат на резултатот од исходот и кликнете на копчето "Признајте".
- По обработката, чие времетраењето зависи целосно од износот на документот, можете да преземете готови датотека со податоци за текст со едноставно со кликнување на неговото име.
Или извоз на еден од достапните облак услуги.
Услугата е веројатно најточни алгоритми за препознавање текст на слики и PDF датотеки. Но, за жал, неговата слободна употреба е ограничена на пет обработени страници месечно. За работа со повеќе обемни документи, ќе мора да купите годишна претплата.
Меѓутоа, ако функцијата OCR е потребна доста ретко, Abbyy Finereader Online е одлична опција за извлекување на текст од мали PDF датотеки.
Метод 2: бесплатен онлајн OCR
Едноставен и удобен текст дигитализиран текст. Без потреба да се регистрирате, ресурсот ви овозможува да препознаете 15 полни PDF страници на час. Бесплатно онлајн OCR целосно работи со документи на 46 јазици и без овластување поддржува три текст извоз - DOCX, XLSX и TXT.
Кога се регистрирате, корисникот добива можност да ги обработува документите со повеќе страници, сепак, слободниот број на овие страници е ограничен на 50 единици.
Онлајн служба бесплатно онлајн OCR
- За да го препознаете текстот од PDF како "гостин", без овластување на ресурсот, користете ја соодветната форма на главната страница на страницата.
Изберете го саканиот документ користејќи го копчето за датотека, наведете го главниот јазик на текстот, излезниот формат, а потоа почекајте датотеката за преземање и кликнете Конвертирајте го.
- На крајот од процесот на дигитализација, кликнете "Преземи излез датотека" за да го зачувате готовиот документ со текстот на компјутерот.
За овластените корисници, редоследот на активностите е поинаква.
- Користете го копчето "Регистрирај се" или "најава" во горниот дел од менито, соодветно, креирајте бесплатна онлајн OCR сметка или одете на него.
- По овластувањето во советот за препознавање, држејќи го копчето "CTRL", одберете до два јазика на изворниот документ од предложената листа.
- Наведете дополнителни параметри за екстракција на текст од PDF и кликнете на копчето Select File за да го преземете документот на услугата.
Потоа, за да продолжите со препознавање, кликнете "Конвертирај".
- На крајот од обработката на документот, кликнете на врската наречена излезна датотека во соодветната колона.
Резултатот од признавањето веднаш ќе биде зачуван во меморијата на вашиот компјутер.
Доколку е потребно, отстранете го текстот од мал PDF документ може да биде безбеден за прибегнување кон употребата на алатката опишана погоре. За да работите со обемни датотеки, ќе мора да купите дополнителни знаци во бесплатни онлајн OCR или прибегнување кон друго решение.
Метод 3: Њубор
Целосно бесплатна OCR услуга која ви овозможува да извлечете текст од речиси сите графички и електронски документи како DJVU и PDF. Ресурсот не наметнува ограничувања за големината и бројот на препознатливи датотеки, не бара регистрација и нуди широк спектар на сродни функции.
NewCorock поддржува 106 јазици и правилно може да обработува дури и со низок квалитет на документи. Можно е рачно да се избере областа за препознавање текст на страната со датотеки.
Онлајн сервис newocr.
- Значи, можете веднаш да започнете со ресурс, без потреба да вршите дополнителни дејства.
Право на главната страница постои форма за увоз на документ на страницата. За да ја преземете датотеката во Њуборко, користете го копчето Select File во изборот на вашата датотека. Потоа, во полето "Јазикот за препознавање", наведете еден или повеќе изворни јазици на документите, а потоа кликнете "Додај + OCR".
- Наведете ги прилагодените прилагодувања за препознавање, одберете ја саканата страница за да го превземете текстот и кликнете на копчето OCR.
- Скролувајте надолу по страницата малку пониска и пронајдете го копчето "Преземи".
Кликнете на неа и во паѓачката листа, одберете го саканиот формат на документот за преземање. После тоа, завршената датотека со извлечен текст ќе биде преземена на вашиот компјутер.
Алатката е погодна и доста ги препознава сите знаци. Сепак, обработката на секоја страница на увезениот PDF документ мора да биде лансирана независно и е прикажана во посебна датотека. Се разбира, можете веднаш да ги копирате резултатите од препознавањето во таблата со исечоци и да ги комбинирате со други.
Сепак, со оглед на горенаведената нијанса, големи количини на текст користејќи Њуборк за извлекување многу тешко. Со мали датотеки, услугата се справува со "со тресок".
Метод 4: OCR.SPACE
Едноставен и разбирлив ресурс за текстуална дигитализација ви овозможува да ги препознаете PDF документите и да го изнесете резултатот во датотеката TXT. Не се обезбедени ограничувања во бројот на страници. Единствено ограничување е големината на влезниот документ не треба да надминува 5 мегабајти.
Онлајн сервис OCR.Space.
- Вие не треба да се регистрирате за да работите со алатката.
Само кликнете на врската погоре и преземете го PDF-документот на страницата од компјутерот користејќи го копчето "Избери датотека" или од мрежата со референца.
- Во опаѓачката листа на OCR јазик, одберете го јазикот на увезениот документ.
Потоа извршете го процесот на препознавање текст со кликнување на копчето "Start OCR!".
- На крајот од обработката на датотеки, видете го резултатот во полето за резултат на OCR и кликнете "Преземи" за да го преземете готовиот документ Txt.
Ако само треба да извлечете текст од PDF и во исто време конечното форматирање што воопшто не е важно, OCR.Space е добар избор. Единствениот, документот мора да биде "едногодишен", бидејќи признавањето на два или повеќе јазици истовремено во услугата не е обезбедено.
Прочитајте исто така: финалиментарни аналози
Оценувањето на онлајн инструментите презентирани во статијата треба да се забележи дека finereader Online од Abbyy е најточна и квалитативно со функцијата OCR. Ако сте важни за вас максимална деформитет на препознавањето на текстот, најдобро е да се разгледа конкретно оваа опција. Но, тие најверојатно ќе го платат за него.
Ако ви треба дигитализација на мали документи и сте подготвени правилно да ги корегирате грешките на услугите, препорачливо е да користите NewCrons, OCR.SPACE или бесплатен онлајн OCR.