Tekst ne možete uvijek ukloniti iz PDF datoteke pomoću uobičajene metode kopiranja. Često su stranice takvih dokumenata skenirani sadržaj njihovih papira opcije. Da biste takve datoteke pretvorili u potpuno uređivanje tekstualnih podataka, posebni programi koriste se s funkcijom optičkog prepoznavanja znakova (OCR).
Takve odluke su vrlo složene u prodaji i stoga postoje znatni novac. Ako trebate redovito prepoznavanje teksta s PDF-om, bit će prilično preporučljivo kupiti odgovarajući program. Za rijetke slučajeve, jedna od dostupnih online usluga sa sličnim značajkama bit će logičnija.
Kako prepoznati tekst s PDF-om na mreži
Naravno, skup značajki OCR online usluga, u usporedbi s punopravnim desktop rješenja, je ograničena. Ali moguće je raditi s takvim resursima ili potpuno slobodnim ili za simboličku naknadu. Glavna stvar je da sa svojim glavnim zadatkom, naime, s prepoznavanjem teksta, odgovarajuće web aplikacije će se nositi kao dobro.Metoda 1: Abbyy Finareader Online
Usluga tvrtka tvrtka je jedan od vođa u području optičkog prepoznavanja dokumenata. Abbyy Finereader za Windows i Mac je moćno rješenje za pretvaranje PDF-a u tekst i dodatno raditi s njom.
Web analog programa, naravno, inferiorno je od funkcionalnosti. Ipak, usluga može prepoznati tekst od skeniranja i fotografija na više od 190 jezika. Podržana PDF datoteka pretvorbe u Word, Excel dokumente itd.
Online servis Abbyy FineReader Online
- Prije početka rada s alatom, stvorite račun na web-lokaciji ili se prijavite u Facebook, Google ili Microsoft račun.
Da biste otišli na prozor autorizacije, kliknite gumb "Prijava" u glavnoj ploči izbornika.
- Prijavom uvesti željeni PDF dokument u FineReader, pomoću gumba "Preuzimanje datoteka".
Zatim kliknite "Odabir stranice brojeva" i navedite željeni razmak za prepoznavanje teksta.
- Zatim odaberite jezike prisutne u dokumentu, format datoteke ishoda i kliknite na gumb "Prepoznavanje".
- Nakon obrade, trajanje ovisi u potpunosti na količini dokumenta, možete preuzeti gotovu datoteku s tekstualnim podacima jednostavnim klikom na njegovo ime.
Ili ga izvozite na jednu od dostupnih usluga u oblaku.
Usluga je vjerojatno najtočniji algoritmi za prepoznavanje teksta na slikama i PDF datotekama. No, nažalost, njegova besplatna uporaba ograničena je na pet prerađenih stranica mjesečno. Raditi s više voluminoznih dokumenata, morat ćete kupiti godišnju pretplatu.
Međutim, ako je OCR funkcija potrebno sasvim rijetko, ABBYY Finereader Online je izvrsna opcija za izdvajanje teksta iz malih PDF datoteka.
Metoda 2: Besplatne online OCR
Jednostavan i praktičan tekst teksta. Bez potrebe za registracijom, resurs vam omogućuje prepoznavanje 15 punih PDF stranica po satu. Besplatni Online OCR u potpunosti radi s dokumentima na 46 jezika i bez odobrenja podržava tri teksta izvoz - docx, xlsx i txt.
Kada se registrira, korisnik dobiva priliku za obradu dokumenata s više stranica, međutim, slobodan broj ovih stranica je ograničen na 50 jedinica.
Online usluga Besplatno online OCR
- Da biste prepoznali tekst iz PDF-a kao "gost", bez odobrenja na resursu, koristite odgovarajući obrazac na glavnoj stranici stranice.
Odaberite željeni dokument pomoću gumba File, navedite glavni jezik teksta, izlaznog formata, a zatim pričekajte da je datoteka preuzimanje i kliknite Pretvori.
- Na kraju procesa digitalizacije kliknite "Download Output File" za spremanje gotovog dokumenta s tekstom na računalu.
Za ovlaštene korisnike slijed djelovanja je nešto drugačiji.
- Koristite gumb "Registriraj" ili "Prijava" u glavnoj ploči izbornika na, odnosno, stvorite besplatni online OCR račun ili idite na njega.
- Nakon odobrenja na ploči za prepoznavanje, držite tipku "Ctrl", odaberite na dva jezika izvornog dokumenta s predloženog popisa.
- Navedite daljnje parametre ekstrakcije teksta iz PDF-a i kliknite gumb Odabir datoteke da biste preuzeli dokument na uslugu.
Zatim, da biste nastavili s prepoznavanjem, kliknite "Pretvori".
- Na kraju obrade dokumenta kliknite na vezu koja se zove izlazna datoteka u odgovarajućem stupcu.
Rezultat prepoznavanja odmah će se spremiti u memoriju vašeg računala.
Ako je potrebno, uklonite tekst iz malog PDF dokumenta može biti siguran za pribjeđivanje korištenju gore opisanog alata. Da biste radili s voluminoznim datotekama, morat ćete kupiti dodatne znakove u besplatnom online OCR ili pribjeći drugoj otopini.
Metoda 3: NewCor
Potpuno slobodna OCR usluga koja vam omogućuje da izvučete tekst iz gotovo svih grafičkih i elektroničkih dokumenata kao što je DJVU i PDF. Resurs ne nameće ograničenja na veličinu i broj prepoznatljivih datoteka, ne zahtijeva registraciju i nudi širok raspon povezanih funkcija.
Newocr podržava 106 jezika i može ispravno obraditi čak i niske kvalitete skeniranja dokumenata. Moguće je ručno odabrati područje prepoznavanja teksta na stranici datoteke.
Online servis newcr
- Dakle, možete odmah početi raditi s resursom, bez potrebe za izvršavanjem dodatnih radnji.
Pravo na glavnoj stranici postoji obrazac za uvoz dokumenta na web-lokaciju. Da biste preuzeli datoteku u NewCor, koristite gumb Odabir datoteke u odjeljku Odabir datoteke. Zatim u polje "Prepoznavanje jezika", navedite jedan ili više izvornih jezika dokumenata, a zatim kliknite "Upload + OCR".
- Navedite željene postavke prepoznavanja, odaberite željenu stranicu kako biste preuzeli tekst i kliknite na gumb OCR.
- Pomaknite se dolje na stranici neznatno niže i pronađite gumb "Download".
Kliknite na njega i na padajućem popisu odaberite željeni format dokumenta za preuzimanje. Nakon toga, gotova datoteka s izvađenim tekstom će se preuzeti na vaše računalo.
Alat je zgodan i prilično dobro prepoznaje sve znakove. Međutim, obrada svake stranice uvezenog PDF dokumenta mora se pokrenuti neovisno i prikazuje se u zasebnoj datoteci. Možete, naravno, odmah kopirati rezultate prepoznavanja u međuspremnik i kombinirati ih s drugima.
Ipak, s obzirom na gore opisane nijanse, velike količine teksta koristeći newkru za ekstrakt vrlo teško. S malim datotekama, usluga se nosi "s praskom".
Metoda 4: OCR.Space
Jednostavan i razumljiv resurs za digitalizaciju teksta omogućuje vam prepoznavanje PDF dokumenata i izlaz rezultata u TXT datoteku. Nijedna ograničenja u broju stranica ne daje. Jedino ograničenje je veličina ulaznog dokumenta ne smije prelaziti 5 megabajta.
Online usluga OCR.Space
- Ne morate se registrirati za rad s alatom.
Samo kliknite na gornju vezu i preuzmite PDF dokument na web-lokaciju s računala pomoću gumba "Select Datoteka" ili iz mreže prema referenci.
- U padajućem popisu Odabir OCR jezika odaberite jezik uvezenog dokumenta.
Zatim pokrenite postupak prepoznavanja teksta klikom na gumb "Start OCR!".
- Na kraju obrade datoteka, pogledajte rezultat u polju OCR'ed Rezultat i kliknite "Download" za preuzimanje gotovog TXT dokumenta.
Ako samo trebate izdvojiti tekst iz PDF-a i istovremeno konačno oblikovanje uopće nije važno, OCR.Space je dobar izbor. Jedini, dokument mora biti "jednoznačni", budući da priznavanje dva ili više jezika istovremeno u službi nije osigurana.
Pročitajte i: Finareader Besplatni analozi
Ocjenjivanje online instrumenata prikazanih u članku treba napomenuti da je Finareader Online iz Abbyy najtočniji i kvalitativno s OCR funkcijom. Ako ste važni za vas maksimalno deformitet prepoznavanja teksta, najbolje je uzeti u obzir konkretno ovu opciju. Ali oni će ga najvjerojatnije platiti za njega.
Ako trebate digitalizaciju malih dokumenata i spremni ste ispraviti ispravne pogreške, preporučljivo je koristiti newocr, OCR.Space ili Besplatno Online OCR.