Ako rozpoznať súbor PDF online

Anonim

Ako rozpoznať súbor PDF online

Text nemôžete vždy odstrániť zo súboru PDF pomocou použitej metódy obvyklého kopírovania. Stránky takýchto dokumentov sú často naskenovaný obsah svojich možností papiera. Pre konverziu takýchto súborov na úplné upraviteľné textové údaje sa špeciálne programy používajú s funkciou optického charakteru (OCR).

Takéto rozhodnutia sú veľmi zložité v predaji, a preto existujú značné peniaze. Ak je potreba rozpoznávania textu s PDF, budete pravidelne vystupovať, bude sa tiež vhodné zakúpiť príslušný program. V zriedkavých prípadoch bude jedna z dostupných online služieb s podobnými funkciami logická.

Ako rozpoznať text s pdf online

Samozrejmosťou je súbor funkcií online služieb OCR v porovnaní s plnohodnotnými desktopovými riešeniami, je obmedzenejšie. Je však možné pracovať s takýmito zdrojmi alebo úplne zadarmo alebo pre symbolický poplatok. Hlavnou vecou je, že s hlavnou úlohou, a to s rozpoznaním textu, zodpovedajúce webové aplikácie sa tiež vyrovnávajú.

Metóda 1: ABBYY FineReader online

Služba Developer Company je jedným z lídrov v oblasti optického uznania dokumentov. ABBYY FineReader pre Windows a Mac je výkonné riešenie pre konverziu PDF na text a ďalšiu prácu s ním.

Webový analóg programu, samozrejme, je nižšia ako funkčnosť. Služba však môže rozpoznať text od skenovania a fotografií vo viac ako 190 jazykoch. Podporovaná konverzia súborov PDF na slovo, Dokumenty Excel atď.

Online Service ABBYY FineReader online

  1. Skôr ako začnete pracovať s nástrojom, vytvorte si účet na stránke alebo prihláste sa pomocou účtu Facebook, Google alebo Microsoft.

    Registrácia v online službe ABBYY FineReader online

    Ak chcete prejsť do okna Autorization, kliknite na tlačidlo "Prihlásenie" v paneli horného menu.

  2. Prihlásením sa importujte požadovaný dokument PDF v FineReader, pomocou tlačidla "Download Files".

    Rozpoznanie textu z dokumentu PDF v online službe ABBYY FineReader online

    Potom kliknite na tlačidlo "Vybrať čísla stránok" a zadajte požadovanú medzeru, aby ste rozpoznali text.

  3. Potom vyberte jazyky prítomné v dokumente, formát súboru výsledkov a kliknite na tlačidlo "Rozpoznať".

    Začiatok rozpoznávania textu z dokumentu PDF v ABBYY FineReader online

  4. Po spracovaní, ktorého trvanie závisí úplne v množstve dokumentu, môžete si stiahnuť hotový súbor s textovými údajmi jednoduchým kliknutím na jeho meno.

    Sťahovanie hotového dokumentu z online služby ABBYY FineReader online

    Buď ho exportovať do jednej z dostupných služieb Cloud.

Služba je pravdepodobne najpresnejšie algoritmy rozpoznávania textu na obrázkoch a súboroch PDF. Ale, bohužiaľ, jeho bezplatné používanie je obmedzené na päť-spracované stránky mesačne. Ak chcete pracovať s viac objemnými dokumentmi, budete musieť kúpiť ročné predplatné.

Ak je však funkcia OCR potrebná pomerne zriedka, ABBYY FineReader online je vynikajúcou možnosťou extrahovať textu z malých súborov PDF.

Metóda 2: Online Online OCR

Jednoduchý a pohodlný text digitalizácia. Bez potreby registrácie, zdroj vám umožňuje rozpoznať 15 plných stránok PDF za hodinu. Bezplatné online OCR plne pracuje s dokumentmi v 46 jazykoch a bez oprávnenia podporuje tri textové exporty - DOCX, XLSX a TXT.

Pri registrácii užívateľ dostane možnosť spracovať viacstránkové dokumenty, avšak bezplatné číslo týchto stránok je obmedzené na 50 jednotiek.

Online Service Online Online OCR

  1. Ak chcete rozpoznať text z PDF ako "hosť", bez oprávnenia na zdroji, použite príslušnú formu na hlavnej stránke stránky.

    PDF Uznanie v Online Online Online OCR

    Pomocou tlačidla File vyberte požadovaný dokument, zadajte hlavný jazyk textu, výstupného formátu, potom počkajte, kým súbor prevezmete a kliknite na položku Konvertovať.

  2. Na konci procesu digitalizácie kliknite na "Prevziať výstupný súbor", aby ste uložili hotový dokument s textom na počítači.

    Vkladanie výsledkov rozpoznávania textu s PDF z Online Online Online Service OCR

Pre oprávnených používateľov je postupnosť opatrení trochu inak.

  1. Tlačidlo "Register" alebo "Prihlásenie" v paneli horného menu, resp. Vytvorte si zadarmo online účet OCR alebo choďte naň.

    Vytvorenie účtu v online online OCR

  2. Po autorizácii v paneli rozpoznávania, prijímať kľúč "CTRL", vyberte až dva jazyky zdrojového dokumentu z navrhovaného zoznamu.

    Definícia jazykov zdrojového dokumentu pre rozpoznávanie textu vo voľnom online OCR

  3. Zadajte ďalšie parametre extrakcie textu z PDF a kliknite na tlačidlo Vybrať súbor, aby ste si stiahli dokument do služby.

    Začiatok rozpoznávania dokumentov PDF v online službe Online Online OCR

    Potom pokračujte v rozpoznaní, kliknite na tlačidlo "Konvertovať".

  4. Na konci spracovania dokumentu kliknite na odkaz nazývaný výstupný súbor vo vhodnom stĺpci.

    Sťahovanie hotového súboru DOCX z bezplatného online služby OCR Online

    Výsledok rozpoznávania sa okamžite uloží do pamäte počítača.

V prípade potreby odstráňte text z malého dokumentu PDF môže byť bezpečný, aby sa uchýlili k použitiu vyššie opísaného nástroja. Ak chcete pracovať s objemnými súbormi, budete musieť kúpiť ďalšie znaky zadarmo online OCR alebo rezort na iné riešenie.

Metóda 3: Newococr

Plne bezplatná služba OCR, ktorá vám umožní extrahovať text z takmer všetkých grafických a elektronických dokumentov, ako je DJVU a PDF. Zdroj nezakladá obmedzenia veľkosti a počtu rozpoznateľných súborov, nevyžaduje registráciu a ponúka širokú škálu súvisiacich funkcií.

Newocr podporuje 106 jazykov a môže správne spracovať aj nízko kvalitné prehľadávanie dokumentov. Na stránke súborov je možné manuálne vybrať oblasť rozpoznávania textu.

Online Service Newocr

  1. Takže, môžete začať pracovať so zdrojom okamžite, bez nutnosti vykonávať ďalšie akcie.

    Načítanie súboru PDF rozpoznať online službu Newoccoc

    Priamo na hlavnej stránke je formulár na import dokumentu na stránku. Ak chcete súbor prevziať v Novomoc, použite tlačidlo Select File v sekcii Vybrať súbor. Potom v poli "rozpoznávacie jazyky", zadajte jeden alebo viac zdrojových jazykov dokumentu a potom kliknite na tlačidlo "Upload + OCR".

  2. Zadajte svoje preferované nastavenia rozpoznávania, vyberte požadovanú stránku na získanie textu a kliknite na tlačidlo OCR.

    Nastavenie a spustenie rozpoznávania textu s PDF v online službe Newocr

  3. Prejdite na stránku mierne nižšiu a nájdite tlačidlo "Download".

    Stiahnite si v novom texte Newoccr

    Kliknite naň a v rozbaľovacom zozname vyberte požadovaný formát dokumentu na prevzatie. Potom sa hotový súbor s extrahovaným textom stiahne do počítača.

Nástroj je pohodlný a pomerne dobre rozpozná všetky znaky. Spracovanie každej strany dovážaného dokumentu PDF sa však musí spustiť nezávisle a zobrazí sa v samostatnom súbore. Samozrejme, môžete okamžite skopírovať výsledky rozpoznávania do schránky a kombinovať ich s ostatnými.

Vzhľadom na vyššie opísaný nuanciu, veľké objemy textu s použitím NOVINKUJÚCEHO DOPRAVUJÚCEHO NOVINKUJÚCEHO VYHLÁDANIA. S malými súbormi sa servis vyrovnajú "s treskom".

Metóda 4: OCR.SPACE

Jednoduchý a zrozumiteľný zdroj pre digitalizáciu textu vám umožňuje rozpoznať dokumenty PDF a výstupom v súbore TXT. Žiadne limity v počte strán nie sú poskytnuté. Jediným obmedzením je veľkosť vstupného dokumentu, nesmie prekročiť 5 megabajtov.

Online servis OCR.SPACE

  1. Nemusíte sa zaregistrovať do práce s nástrojom.

    Importovať súbor PDF v online službe OCR.SPACE

    Stačí kliknúť na odkaz vyššie a prevziať dokument PDF na stránku z počítača pomocou tlačidla "Vybrať súbor" alebo zo siete pomocou odkazu.

  2. V rozbaľovacom zozname Vyberte jazyk jazyka, vyberte jazyk importovaného dokumentu.

    Spustenie procesu rozpoznávania dokumentov PDF v online službe OCR.SPACE

    Potom spustite proces rozpoznávania textu kliknutím na tlačidlo "Štart OCR!".

  3. Na konci spracovania súborov pozrite si výsledok v poli Výsledok OCR'ed a kliknite na tlačidlo "Download" na stiahnutie hotového dokumentu TXT.

    Sťahovanie výsledku rozpoznávania súborov PDF z online služby OCR.SPACE

Ak potrebujete extrahovať text z PDF a zároveň konečné formátovanie nie je dôležité, OCR.SPACE je dobrou voľbou. Jediný dokument musí byť "jednochodný", pretože uznanie dvoch alebo viacerých jazykov súčasne v službe nie je poskytnutá.

Prečítajte si aj: FineReader Bezplatný analógy

Vyhodnotenie online nástrojov uvedených v článku je potrebné poznamenať, že FineReader online z ABBYY je najpresnejší a kvalitatívne s funkciou OCR. Ak ste pre vás dôležitý maximálnu deformnosť rozpoznávania textu, je najlepšie zvážiť konkrétne túto možnosť. Ale s najväčšou pravdepodobnosťou zaplatia za neho.

Ak potrebujete digitalizáciu malých dokumentov a ste pripravení správne správnych servisných chýb, odporúča sa používať Newocr, Ocr.Space alebo zadarmo online OCR.

Čítaj viac