Kuidas tunda PDF-faili võrgus

Anonim

Kuidas tunda PDF-faili võrgus

Teilt ei saa alati teksti eemaldada PDF-failist tavalise koopia meetodi abil. Sageli on selliste dokumentide leheküljed oma paberi valikute skaneeritud sisu. Selliste failide muutmiseks täielikult redigeeritavateks tekstiandmeks kasutatakse spetsiaalseid programme koos optilise iseloomu tuvastamise (OCR) funktsiooniga.

Sellised otsused on müügi väga keerulised ja seetõttu on olemas märkimisväärne raha. Kui vajadus teksti tunnustamise järele PDF-ga tekib regulaarselt, on üsna soovitatav asjakohase programmi osta. Harvadel juhtudel on üks sarnaste funktsioonidega võrguteenuseid loogilisemad.

Kuidas tuvastada teksti PDF-ga võrgus

Loomulikult on OCR-i võrguteenuste omaduste komplekt võrreldes täieliku töölaua lahendustega võrreldes piiratud. Kuid selliste ressursside või täiesti tasuta või sümboolse tasuga on võimalik töötada. Peamine asi on see, et selle peamise ülesandega, nimelt teksti tunnustamisega, hakkavad vastavad veebirakendused ka toime tulema.

Meetod 1: ABBYY FineReader Online

Teenuse arendaja ettevõte on üks juhte dokumentide optilise tunnustamise valdkonnas. ABBYY FineReader for Windows ja Mac on võimas lahendus PDF-i konverteerimiseks tekstile ja edasiseks tööks.

Programmi veebianaloog, muidugi on see funktsionaalsuse järgi halvem. Sellegipoolest saab teenus tunnustada skaneerimise ja fotode teksti enam kui 190 keeles. Toetatud PDF-failide konverteerimine Wordile, Exceli dokumentidele jne

Online Service ABBYY FineReader Online

  1. Enne tööriistaga töötamise alustamist looge saidil konto või logige sisse Facebooki, Google'i või Microsofti kontoga.

    Registreerimine online-teenuse ABBYY FineReader Online

    Volitusaknasse avamiseks klõpsake nupul "Logi sisse" nupul Üles Menüü paneelis.

  2. Sisselogimisel, importida soovitud PDF-dokument FineReaderis, kasutades nuppu "Lae failid".

    Teksti tunnustamine PDF-dokumendist võrguteenusest ABBYY FineReaderi võrgus

    Seejärel klõpsake "Vali lehekülje numbrid" ja täpsustage teksti äratundmiseks soovitud lõhe.

  3. Järgmisena valige dokumendis olevad keeled, tulemusfaili formaat ja klõpsa nupule "Tuvastamine".

    Alustamine teksti tunnustamise PDF dokumendi ABBYY FineReader Online

  4. Pärast töötlemist, mille kestus sõltub täielikult dokumendi suurusest, saate alla laadida tekstiandmetega valmis faili, klõpsates lihtsalt selle nimele.

    Lõpetatud dokumendi allalaadimine võrguteenusest ABBYY FineReader Online

    Kas eksportida seda ühele olemasolevatele pilveteenustele.

Teenus on ilmselt kõige täpsemad tekstide tuvastamise algoritmid piltide ja PDF-failide kohta. Kuid kahjuks on selle vaba kasutamine piiratud viie töödeldud leheküljega kuus. Et töötada rohkem mahukamaid dokumente, peate ostma iga-aastase tellimuse.

Kui OCR-funktsioon on vajalik üsna harva, on ABBYY FineReader Online suurepärane võimalus teksti väljavõtmiseks väikestest PDF-failidest.

Meetod 2: tasuta online OCR

Lihtne ja mugav teksti digiteeritav tekst. Ilma vajaduse registreerimise vajaduseta ressurss võimaldab teil tunnustada 15 täielikku PDF-lehekülge tunnis. Tasuta online OCR töötab täielikult dokumentidega 46 keeles ja ilma loata toetab kolme teksti eksporti - docx, xlsx ja txt.

Registreerimisel saab kasutaja võimaluse töödelda mitme lehekülje dokumente, kuid nende lehekülgede vaba arv on piiratud 50 ühikuga.

Online-teenus tasuta online OCR

  1. Tunnistage PDF-i tekst kui "külaline", ilma ressursi loata kasutage sobivat vormi kohapeal leheküljel.

    PDF tunnustamine internetis tasuta online OCR

    Valige soovitud dokument, kasutades faili nuppu, täpsustage teksti peamine keel, väljundvorming, seejärel oodake faili allalaadimiseks ja klõpsamiseks.

  2. Lõpus digiteerimise protsessi, klõpsake "Laadi väljastusfail" salvestada lõpetatud dokumendi teksti arvutis.

    Tekstituvastuse laadimine Tulemused PDF-iga tasuta online OCR-võrguteenusega

Volitatud kasutajatele on toimingute järjestus mõnevõrra erinev.

  1. Kasutage vastavalt ülemisse menüü paneeli nuppu "Registreeri" või "Logi sisse", looge tasuta online OCR-konto või mine selle juurde.

    Konto loomine online-free online OCR-is

  2. Pärast tunnustuse paneelil loa, valige "Ctrl" võtme hoidmine, kui kavandatavast nimekirjast valige allika dokumendi allika dokumendi keel.

    Teksti tunnustamise lähtedokumendi keelte määratlus tasuta online OCR-is

  3. Määrake täiendavad teksti ekstraheerimisparameetrid PDF-st ja klõpsake dokumendi allalaadimiseks teenusesse.

    PDF-i dokumendi tuvastamise algus online-teenus Tasuta Online OCR

    Seejärel jätkake tunnustamise jätkamist, klõpsake "Teisenda".

  4. Dokumendi töötlemise lõpus klõpsake soovitud kolonnis asuva väljundfaili nimega link.

    Allalaadimine valmis docx faili tasuta online OCR Online Service

    Tunnustamise tulemus salvestatakse kohe teie arvuti mällu.

Vajadusel eemaldage väikese PDF-dokumendi tekst, et kasutada ülalkirjeldatud tööriista kasutamist. Töötada mahukate failidega, peate ostma täiendavaid märke tasuta online OCR-i või teise lahenduse korral.

3. meetod: newochi

Täielikult tasuta OCR-teenus, mis võimaldab teil välja võtta peaaegu igasuguseid graafilisi ja elektroonilisi dokumente nagu DJVU ja PDF. Ressurss ei kehtestata kindlaksmääratud failide suuruse ja arvu piiranguid, ei nõua registreerimist ja pakub laia valikut seotud funktsioone.

Newsochi toetab 106 keelt ja saab korralikult töödelda dokumentide madala kvaliteediga skaneeringuid. Faililehekülje teksti tuvastamise ala on võimalik valida käsitsi valida.

Online Service Newoch

  1. Niisiis, saate kohe ressursiga töötada, ilma et oleks vaja teha täiendavaid meetmeid.

    PDF-faili laadimine online-teenuse tunnustamiseks Newochi

    Õigus põhil leheküljel on vorm importiva dokumendi saidile. Faili allalaadimiseks Newocr'is kasutage valitud faili nuppu Vali faili jaotises. Seejärel täpsustage väljale "Tunnustamise keel (id)" ühe või mitu allika dokumendi keeli ja seejärel klõpsake "Upload + OCR".

  2. Määrake oma eelistatud tunnustamise seaded, valige soovitud lehekülg ja klõpsake nuppu OCR.

    Tekstituvastuse seadistamine ja käivitamine PDF-iga Online Service Newoch

  3. Leidke leht allapoole ja leidke nupp "Laadi alla".

    Allalaadinud õppinud Newochi teksti arvutis

    Klõpsake seda ja rippmenüüst valige allalaadimiseks soovitud vorming. Pärast seda alla laaditakse teie arvutisse ekstraheeritud teksti valmisfail.

Tööriist on mugav ja üsna hästi tuvastab kõik tähemärgid. Imporditud PDF-dokumendi iga lehekülje töötlemine peab siiski käivitama iseseisvalt ja kuvatakse eraldi failis. Loomulikult saate kopeerida tunnustamise tulemusi kohe lõikepuhvrisse ja ühendada need teistega.

Sellegipoolest arvestades ülalkirjeldatud nüanss, suured tekstimahud, kasutades newochi ekstraheerimist väga raskeks. Väikesed failid, Teenus hakkab "pauguga".

Meetod 4: OCr.Space

Lihtne ja arusaadav ressurss teksti digiteerimiseks võimaldab teil tunda PDF-dokumente ja väljundas TXT-faili tulemuse. Lehekülgede arvu piiranguid ei pakuta. Ainus piirang on sisenddokumendi suurus ei tohiks ületada 5 megabaiti.

Online Service OCr.Space

  1. Teil ei ole vaja tööriista töötamiseks registreerida.

    Import PDF-fail Internetis Ocr.Space Service

    Lihtsalt klõpsake ülaloleval lingil ja alla laadida PDF-dokumenti saidile arvutist, kasutades nuppu "Vali fail" nupuga või võrgu kaudu.

  2. Valige OCR keele rippmenüüst, valige imporditud dokumendi keel keel.

    PDF-dokumendi tuvastamise protsessi käivitamine online-teenus OCR.Space'is

    Seejärel käivitage teksti tuvastamise protsess, klõpsates nuppu "Start OCR!".

  3. Faili töötlemise lõpus vaadake tulemust OCR'ED tulemusvaldkonnas ja klõpsake "Laadi alla", et alla laadida lõpetatud TXT-dokumendi allalaadimiseks.

    PDF-faili tunnustamise tulemuste allalaadimine OCr.Space Online Service'ist

Kui teil on vaja lihtsalt eraldada PDF-lt ja samal ajal on lõplik vormindamine üldse tähtis, Ocr.Space on hea valik. Ainus, dokument peab olema "ühe keelt", kuna kahe või enama keele tunnustamine samaaegselt teenistuses ei ole ette nähtud.

Lugege ka: FineReader Tasuta analoogid

Artiklis esitatud online-instrumentide hindamine tuleks märkida, et FineReader Online ABBYY on kõige täpsem ja kvalitatiivselt OCR-funktsiooniga. Kui olete teile oluline teksti tunnustamise maksimaalne deformatsioon, on kõige parem kaaluda konkreetselt seda võimalust. Aga nad maksavad kõige tõenäolisemalt tema eest.

Kui vajate väikeste dokumentide digiteerimist ja olete valmis õigesti õigesti õigesti parandama, on soovitatav kasutada Newocr, OCR.Space'i või tasuta online OCR-i.

Loe rohkem