Kako prepoznati PDF datoteku Online

Anonim

Kako prepoznati PDF datoteku Online

Tekst ne možete uvijek ukloniti iz PDF datoteke pomoću uobičajene metode kopiranja. Često su stranice takvih dokumenata skenirani sadržaj njihovih papira opcije. Da biste takve datoteke pretvorili u potpuno uređivanje tekstualnih podataka, posebni programi koriste se s funkcijom optičkog prepoznavanja znakova (OCR).

Takve odluke su vrlo složene u prodaji i stoga postoje znatni novac. Ako trebate redovito prepoznavanje teksta s PDF-om, bit će prilično preporučljivo kupiti odgovarajući program. Za rijetke slučajeve, jedna od dostupnih online usluga sa sličnim značajkama bit će logičnija.

Kako prepoznati tekst s PDF-om na mreži

Naravno, skup značajki OCR online usluga, u usporedbi s punopravnim desktop rješenja, je ograničena. Ali moguće je raditi s takvim resursima ili potpuno slobodnim ili za simboličku naknadu. Glavna stvar je da sa svojim glavnim zadatkom, naime, s prepoznavanjem teksta, odgovarajuće web aplikacije će se nositi kao dobro.

Metoda 1: Abbyy Finareader Online

Usluga tvrtka tvrtka je jedan od vođa u području optičkog prepoznavanja dokumenata. Abbyy Finereader za Windows i Mac je moćno rješenje za pretvaranje PDF-a u tekst i dodatno raditi s njom.

Web analog programa, naravno, inferiorno je od funkcionalnosti. Ipak, usluga može prepoznati tekst od skeniranja i fotografija na više od 190 jezika. Podržana PDF datoteka pretvorbe u Word, Excel dokumente itd.

Online servis Abbyy FineReader Online

  1. Prije početka rada s alatom, stvorite račun na web-lokaciji ili se prijavite u Facebook, Google ili Microsoft račun.

    Registracija u online usluzi Abbyy FineReader Online

    Da biste otišli na prozor autorizacije, kliknite gumb "Prijava" u glavnoj ploči izbornika.

  2. Prijavom uvesti željeni PDF dokument u FineReader, pomoću gumba "Preuzimanje datoteka".

    Prepoznavanje teksta iz PDF dokumenta u online usluzi Abbyy Finereader Online

    Zatim kliknite "Odabir stranice brojeva" i navedite željeni razmak za prepoznavanje teksta.

  3. Zatim odaberite jezike prisutne u dokumentu, format datoteke ishoda i kliknite na gumb "Prepoznavanje".

    Početak prepoznavanja teksta iz PDF dokumenta u Abbyy Finereader Online

  4. Nakon obrade, trajanje ovisi u potpunosti na količini dokumenta, možete preuzeti gotovu datoteku s tekstualnim podacima jednostavnim klikom na njegovo ime.

    Preuzimanje gotovog dokumenta s online usluge Abbyy FineReader Online

    Ili ga izvozite na jednu od dostupnih usluga u oblaku.

Usluga je vjerojatno najtočniji algoritmi za prepoznavanje teksta na slikama i PDF datotekama. No, nažalost, njegova besplatna uporaba ograničena je na pet prerađenih stranica mjesečno. Raditi s više voluminoznih dokumenata, morat ćete kupiti godišnju pretplatu.

Međutim, ako je OCR funkcija potrebno sasvim rijetko, ABBYY Finereader Online je izvrsna opcija za izdvajanje teksta iz malih PDF datoteka.

Metoda 2: Besplatne online OCR

Jednostavan i praktičan tekst teksta. Bez potrebe za registracijom, resurs vam omogućuje prepoznavanje 15 punih PDF stranica po satu. Besplatni Online OCR u potpunosti radi s dokumentima na 46 jezika i bez odobrenja podržava tri teksta izvoz - docx, xlsx i txt.

Kada se registrira, korisnik dobiva priliku za obradu dokumenata s više stranica, međutim, slobodan broj ovih stranica je ograničen na 50 jedinica.

Online usluga Besplatno online OCR

  1. Da biste prepoznali tekst iz PDF-a kao "gost", bez odobrenja na resursu, koristite odgovarajući obrazac na glavnoj stranici stranice.

    PDF prepoznavanje u online besplatno OCR

    Odaberite željeni dokument pomoću gumba File, navedite glavni jezik teksta, izlaznog formata, a zatim pričekajte da je datoteka preuzimanje i kliknite Pretvori.

  2. Na kraju procesa digitalizacije kliknite "Download Output File" za spremanje gotovog dokumenta s tekstom na računalu.

    Učitavanje rezultata prepoznavanja teksta s PDF-om iz besplatnog online OCR Online usluge

Za ovlaštene korisnike slijed djelovanja je nešto drugačiji.

  1. Koristite gumb "Registriraj" ili "Prijava" u glavnoj ploči izbornika na, odnosno, stvorite besplatni online OCR račun ili idite na njega.

    Stvaranje računa u online besplatno OCR

  2. Nakon odobrenja na ploči za prepoznavanje, držite tipku "Ctrl", odaberite na dva jezika izvornog dokumenta s predloženog popisa.

    Definicija jezika izvodnog dokumenta za prepoznavanje teksta u besplatnom online OCR

  3. Navedite daljnje parametre ekstrakcije teksta iz PDF-a i kliknite gumb Odabir datoteke da biste preuzeli dokument na uslugu.

    Početak Prepoznavanja PDF dokumenta u online usluzi Free Online OCR

    Zatim, da biste nastavili s prepoznavanjem, kliknite "Pretvori".

  4. Na kraju obrade dokumenta kliknite na vezu koja se zove izlazna datoteka u odgovarajućem stupcu.

    Preuzimanje gotove docx datoteke s besplatne online OCR online usluge

    Rezultat prepoznavanja odmah će se spremiti u memoriju vašeg računala.

Ako je potrebno, uklonite tekst iz malog PDF dokumenta može biti siguran za pribjeđivanje korištenju gore opisanog alata. Da biste radili s voluminoznim datotekama, morat ćete kupiti dodatne znakove u besplatnom online OCR ili pribjeći drugoj otopini.

Metoda 3: NewCor

Potpuno slobodna OCR usluga koja vam omogućuje da izvučete tekst iz gotovo svih grafičkih i elektroničkih dokumenata kao što je DJVU i PDF. Resurs ne nameće ograničenja na veličinu i broj prepoznatljivih datoteka, ne zahtijeva registraciju i nudi širok raspon povezanih funkcija.

Newocr podržava 106 jezika i može ispravno obraditi čak i niske kvalitete skeniranja dokumenata. Moguće je ručno odabrati područje prepoznavanja teksta na stranici datoteke.

Online servis newcr

  1. Dakle, možete odmah početi raditi s resursom, bez potrebe za izvršavanjem dodatnih radnji.

    Učitavanje PDF datoteke da biste prepoznali online uslugu NewCor

    Pravo na glavnoj stranici postoji obrazac za uvoz dokumenta na web-lokaciju. Da biste preuzeli datoteku u NewCor, koristite gumb Odabir datoteke u odjeljku Odabir datoteke. Zatim u polje "Prepoznavanje jezika", navedite jedan ili više izvornih jezika dokumenata, a zatim kliknite "Upload + OCR".

  2. Navedite željene postavke prepoznavanja, odaberite željenu stranicu kako biste preuzeli tekst i kliknite na gumb OCR.

    Postavljanje i pokretanje prepoznavanja teksta s PDF-om u online servisu NewCOR

  3. Pomaknite se dolje na stranici neznatno niže i pronađite gumb "Download".

    Download naučio u NewCork Text na računalu

    Kliknite na njega i na padajućem popisu odaberite željeni format dokumenta za preuzimanje. Nakon toga, gotova datoteka s izvađenim tekstom će se preuzeti na vaše računalo.

Alat je zgodan i prilično dobro prepoznaje sve znakove. Međutim, obrada svake stranice uvezenog PDF dokumenta mora se pokrenuti neovisno i prikazuje se u zasebnoj datoteci. Možete, naravno, odmah kopirati rezultate prepoznavanja u međuspremnik i kombinirati ih s drugima.

Ipak, s obzirom na gore opisane nijanse, velike količine teksta koristeći newkru za ekstrakt vrlo teško. S malim datotekama, usluga se nosi "s praskom".

Metoda 4: OCR.Space

Jednostavan i razumljiv resurs za digitalizaciju teksta omogućuje vam prepoznavanje PDF dokumenata i izlaz rezultata u TXT datoteku. Nijedna ograničenja u broju stranica ne daje. Jedino ograničenje je veličina ulaznog dokumenta ne smije prelaziti 5 megabajta.

Online usluga OCR.Space

  1. Ne morate se registrirati za rad s alatom.

    Uvoz PDF datoteke u online OCR.Space uslugu

    Samo kliknite na gornju vezu i preuzmite PDF dokument na web-lokaciju s računala pomoću gumba "Select Datoteka" ili iz mreže prema referenci.

  2. U padajućem popisu Odabir OCR jezika odaberite jezik uvezenog dokumenta.

    Pokretanje procesa prepoznavanja PDF dokumenta u online usluzi OCR.Space

    Zatim pokrenite postupak prepoznavanja teksta klikom na gumb "Start OCR!".

  3. Na kraju obrade datoteka, pogledajte rezultat u polju OCR'ed Rezultat i kliknite "Download" za preuzimanje gotovog TXT dokumenta.

    Preuzimanje rezultata prepoznavanja PDF datoteka iz OCR.Space online usluge

Ako samo trebate izdvojiti tekst iz PDF-a i istovremeno konačno oblikovanje uopće nije važno, OCR.Space je dobar izbor. Jedini, dokument mora biti "jednoznačni", budući da priznavanje dva ili više jezika istovremeno u službi nije osigurana.

Pročitajte i: Finareader Besplatni analozi

Ocjenjivanje online instrumenata prikazanih u članku treba napomenuti da je Finareader Online iz Abbyy najtočniji i kvalitativno s OCR funkcijom. Ako ste važni za vas maksimalno deformitet prepoznavanja teksta, najbolje je uzeti u obzir konkretno ovu opciju. Ali oni će ga najvjerojatnije platiti za njega.

Ako trebate digitalizaciju malih dokumenata i spremni ste ispraviti ispravne pogreške, preporučljivo je koristiti newocr, OCR.Space ili Besplatno Online OCR.

Čitaj više