Jak rozpoznat soubor PDF Online

Anonim

Jak rozpoznat soubor PDF Online

Text nelze vždy odebrat z souboru PDF pomocí metody obvyklé kopie. Stránky těchto dokumentů jsou často naskenovaným obsahem jejich papírových možností. Chcete-li převést takové soubory do plně upravitelných textových dat, speciální programy se používají s funkcí optického rozpoznávání znaků (OCR).

Tato rozhodnutí jsou velmi složitá v prodeji, a proto existují značné peníze. Je-li potřeba rozpoznávání textu s PDF pravidelně vyplývají, bude docela vhodné nakupovat příslušný program. Pro vzácné případy bude jeden z dostupných online služeb s podobnými funkcemi logičtější.

Jak rozpoznat text s PDF online

Samozřejmě, soubor rysů OCR online služeb, ve srovnání s plnohodnotnými desktopovými řešeními, je omezenější. Ale je možné pracovat s takovými zdroji nebo zcela zdarma nebo pro symbolický poplatek. Hlavní věc je, že s jeho hlavním úkolem, a to s rozpoznáním textu, odpovídající webové aplikace budou vyrovnány stejně.

Metoda 1: ABBYY FineReader Online

Servisní vývojářská společnost je jedním z lídrů v oblasti optického uznávání dokumentů. ABBYY FineReader pro Windows a Mac je výkonným řešením pro převod PDF k textu a další práci s ním.

Webový analogový program, samozřejmě, je pro to podřadný funkčnost. Služba však může rozpoznat text ze skenování a fotografií ve více než 190 jazycích. Podporovaná konverze souboru PDF na slovo, dokumenty aplikace Excel atd.

Online služba ABBYY FineReader online

  1. Než začnete pracovat s nástrojem, vytvořte si účet na webu nebo se přihlaste pomocí účtu Facebook, Google nebo Microsoft.

    Registrace v online službě ABBYY FineReader online

    Chcete-li jít do okna Autorizace, klepněte na tlačítko "Přihlášení" v panelu Top Menu.

  2. Přihlášením importujte požadovaný dokument PDF v FineReader pomocí tlačítka "Stáhnout soubory".

    Rozpoznávání textu z dokumentu PDF v online službě ABBYY FineReader online

    Poté klikněte na "Vybrat čísla stránek" a zadejte požadovanou mezeru rozpoznat text.

  3. Dále vyberte jazyky přítomné v dokumentu, formát výsledného souboru a klikněte na tlačítko "Rozpoznat".

    Začátek rozpoznávání textu z dokumentu PDF v ABBYY FineReader online

  4. Po zpracování, z nichž trvání závisí zcela na množství dokumentu, můžete si stáhnout hotový soubor s textovými daty jednoduchým kliknutím na jeho název.

    Stahování hotového dokumentu z online služby ABBYY FineReader online

    Buď jej exportujte na jeden z dostupných cloudových služeb.

Služba je pravděpodobně nejpřesnější algoritmy rozpoznávání textu na snímků a souborech PDF. Ale bohužel jeho volné použití je omezeno na pět-zpracované stránky za měsíc. Chcete-li pracovat s více objemnými dokumenty, budete muset koupit roční předplatné.

Pokud je však funkce OCR potřebná poměrně zřídka, ABBYY FineReader online je vynikající možností extrahovat text z malých souborů PDF.

Metoda 2: Zdarma online OCR

Jednoduchý a pohodlný text digitalizace textu. Bez nutnosti registrace, zdroj umožňuje rozpoznat 15 plných pdf stránek za hodinu. ZDARMA Online OCR plně pracuje s dokumenty ve 46 jazycích a bez autorizace podporuje tři textové exporty - DOCX, XLSX a TXT.

Při registraci uživatel dostane příležitost zpracovat vícestránkové dokumenty, nicméně volný počet těchto stránek je omezen na 50 jednotek.

Online služba Online OCR

  1. Chcete-li rozpoznat text z PDF jako "host", bez autorizace na zdroje, použijte příslušný formulář na hlavní stránce webu.

    PDF rozpoznávání v online zdarma online OCR

    Pomocí tlačítka Soubor vyberte požadovaný dokument, zadejte hlavní jazyk textu, výstupního formátu, poté počkejte, až soubor ke stažení a klepněte na příkaz Převést.

  2. Na konci procesu digitalizace klepněte na tlačítko "Stáhnout výstupní soubor" pro uložení hotového dokumentu s textem v počítači.

    Načítání výsledků rozpoznávání textu s PDF z bezplatného online OCR online služby

Pro oprávněné uživatele je posloupnost akcí poněkud odlišná.

  1. Použijte tlačítko "Registrovat" nebo "Přihlášení" v panelu horní nabídky, v tomto pořadí, vytvořte bezplatný online účet OCR nebo jděte k němu.

    Vytvoření účtu v online zdarma OCR

  2. Po autorizaci v panelu rozpoznávání, podržením tlačítka "Ctrl", vyberte z navrhovaného seznamu až dva jazyky zdrojového dokumentu.

    Definice jazyků zdrojového dokumentu pro rozpoznávání textu ve volném online OCR

  3. Zadejte další parametry extrakce textu z PDF a klepněte na tlačítko Vybrat soubor pro stažení dokumentu do služby.

    Začátek rozpoznávání dokumentů PDF v online službě Online OCR

    Poté pokračujte s rozpoznáním, klepněte na tlačítko "Převést".

  4. Na konci zpracování dokumentu klikněte na odkaz nazvaný výstupní soubor ve vhodném sloupci.

    Stahování hotového dokumentu DocX z bezplatného online služby OCR online

    Výsledek rozpoznávání bude okamžitě uložen do paměti počítače.

Pokud je to nutné, odstraňte text z malého dokumentu PDF, může být bezpečný pro použití výše popsaného nástroje. Chcete-li pracovat s objemnými soubory, budete muset koupit další znaky ve volném online OCR nebo uchýlit se k jinému řešení.

Metoda 3: NewOcr

Plně bezplatná služba OCR, která umožňuje extrahovat text z téměř jakýchkoli grafických a elektronických dokumentů, jako je DJVU a PDF. Zdroj neukládá omezení velikosti a počtu rozpoznatelných souborů, nevyžaduje registraci a nabízí širokou škálu souvisejících funkcí.

NewOCried podporuje 106 jazyků a může správně zpracovávat i skenování dokumentů s nízkou kvalitou. Na stránce souboru je možné ručně zvolit oblast rozpoznávání textu.

Online služba Newocr.

  1. Takže můžete začít pracovat s prostředkem okamžitě, aniž byste museli provádět další akce.

    Načtení souboru PDF rozpoznat online službu NewOCr

    Přímo na hlavní stránce je formulář pro import dokumentu na webu. Chcete-li stáhnout soubor v NewOCrite, použijte tlačítko Vybrat soubor v části Vybrat souboru. Pak v poli "Rozpoznávání jazyk (S)" zadejte jeden nebo více jazyků zdrojového dokumentu a klepněte na tlačítko "Upload + OCR".

  2. Určete nastavení preferovaných rozpoznávání, vyberte požadovanou stránku pro načtení textu a klikněte na tlačítko OCR.

    Nastavení a spouštění rozpoznávání textu s PDF v online službě NewOCr

  3. Přejděte dolů na stránku mírně nižší a vyhledejte tlačítko "Stáhnout".

    Stáhnout se naučil v NewOcresse Text na počítači

    Klikněte na něj a v rozevíracím seznamu vyberte požadovaný formát dokumentu ke stažení. Poté bude hotový soubor s extrahovaným textem stažen do počítače.

Nástroj je pohodlný a docela dobře rozpoznává všechny znaky. Zpracování každé stránky importovaného dokumentu PDF však musí být spuštěno samostatně a zobrazí se v samostatném souboru. Samozřejmě můžete okamžitě kopírovat výsledky rozpoznávání do schránky a kombinovat je s ostatními.

Nicméně, vzhledem k výše popsanému nuanci, velké objemy textu pomocí NewokoCtion extrahovat velmi obtížné. S malými soubory, Service Copeses "s třeskem."

Metoda 4: Ocr.Space

Jednoduchý a srozumitelný zdroj pro digitalizaci textu vám umožní rozpoznat dokumenty PDF a výstup výsledku do souboru TXT. Žádné limity na počtu stránek nejsou poskytnuty. Jediným omezením je velikost vstupního dokumentu by neměl překročit 5 megabajtů.

Online služba Ocr.Space.

  1. Nemusíte se zaregistrovat do práce s nástrojem.

    Importovat soubor PDF v online Ocr.Space Service

    Stačí kliknout na odkaz výše a stáhnout dokument PDF na web z počítače pomocí tlačítka "Vybrat soubor" nebo ze sítě odkazem.

  2. V rozevíracím seznamu Vybrat jazyk OCR vyberte jazyk importovaného dokumentu.

    Spuštění procesu rozpoznávání dokumentů PDF v online službě Ocr.Space

    Poté spusťte proces rozpoznávání textu klepnutím na tlačítko "Start OCR!".

  3. Na konci zpracování souborů naleznete v výsledku v oblasti výsledku OCR a klepněte na tlačítko "Stáhnout" pro stažení dokončeného dokumentu TXT.

    Stahování výsledku rozpoznávání souborů PDF z online služby OCR.Space

Pokud právě potřebujete extrahovat text z PDF a zároveň finální formátování není důležité vůbec, Ocr.Space je dobrou volbou. Jediný, dokument musí být "jednorázový", protože rozpoznání dvou nebo více jazyků současně ve službě není poskytnuta.

Přečtěte si také: FineReader bezplatné analogy

Vyhodnocení online nástrojů uvedených v článku je třeba poznamenat, že FineReader online od aplikace ABBYY je nejpřesnější a kvalitativně s funkcí OCR. Pokud jste pro vás důležití maximální deformita rozpoznávání textu, je nejlepší zvážit konkrétně tuto možnost. Ale budou s největší pravděpodobností platit za něj.

Pokud potřebujete digitalizaci malých dokumentů a jste připraveni správně správné služby služby, doporučuje se používat NewOCr, Ocr.Space nebo zdarma online OCR.

Přečtěte si více