Text nelze vždy odebrat z souboru PDF pomocí metody obvyklé kopie. Stránky těchto dokumentů jsou často naskenovaným obsahem jejich papírových možností. Chcete-li převést takové soubory do plně upravitelných textových dat, speciální programy se používají s funkcí optického rozpoznávání znaků (OCR).
Tato rozhodnutí jsou velmi složitá v prodeji, a proto existují značné peníze. Je-li potřeba rozpoznávání textu s PDF pravidelně vyplývají, bude docela vhodné nakupovat příslušný program. Pro vzácné případy bude jeden z dostupných online služeb s podobnými funkcemi logičtější.
Jak rozpoznat text s PDF online
Samozřejmě, soubor rysů OCR online služeb, ve srovnání s plnohodnotnými desktopovými řešeními, je omezenější. Ale je možné pracovat s takovými zdroji nebo zcela zdarma nebo pro symbolický poplatek. Hlavní věc je, že s jeho hlavním úkolem, a to s rozpoznáním textu, odpovídající webové aplikace budou vyrovnány stejně.Metoda 1: ABBYY FineReader Online
Servisní vývojářská společnost je jedním z lídrů v oblasti optického uznávání dokumentů. ABBYY FineReader pro Windows a Mac je výkonným řešením pro převod PDF k textu a další práci s ním.
Webový analogový program, samozřejmě, je pro to podřadný funkčnost. Služba však může rozpoznat text ze skenování a fotografií ve více než 190 jazycích. Podporovaná konverze souboru PDF na slovo, dokumenty aplikace Excel atd.
Online služba ABBYY FineReader online
- Než začnete pracovat s nástrojem, vytvořte si účet na webu nebo se přihlaste pomocí účtu Facebook, Google nebo Microsoft.
Chcete-li jít do okna Autorizace, klepněte na tlačítko "Přihlášení" v panelu Top Menu.
- Přihlášením importujte požadovaný dokument PDF v FineReader pomocí tlačítka "Stáhnout soubory".
Poté klikněte na "Vybrat čísla stránek" a zadejte požadovanou mezeru rozpoznat text.
- Dále vyberte jazyky přítomné v dokumentu, formát výsledného souboru a klikněte na tlačítko "Rozpoznat".
- Po zpracování, z nichž trvání závisí zcela na množství dokumentu, můžete si stáhnout hotový soubor s textovými daty jednoduchým kliknutím na jeho název.
Buď jej exportujte na jeden z dostupných cloudových služeb.
Služba je pravděpodobně nejpřesnější algoritmy rozpoznávání textu na snímků a souborech PDF. Ale bohužel jeho volné použití je omezeno na pět-zpracované stránky za měsíc. Chcete-li pracovat s více objemnými dokumenty, budete muset koupit roční předplatné.
Pokud je však funkce OCR potřebná poměrně zřídka, ABBYY FineReader online je vynikající možností extrahovat text z malých souborů PDF.
Metoda 2: Zdarma online OCR
Jednoduchý a pohodlný text digitalizace textu. Bez nutnosti registrace, zdroj umožňuje rozpoznat 15 plných pdf stránek za hodinu. ZDARMA Online OCR plně pracuje s dokumenty ve 46 jazycích a bez autorizace podporuje tři textové exporty - DOCX, XLSX a TXT.
Při registraci uživatel dostane příležitost zpracovat vícestránkové dokumenty, nicméně volný počet těchto stránek je omezen na 50 jednotek.
Online služba Online OCR
- Chcete-li rozpoznat text z PDF jako "host", bez autorizace na zdroje, použijte příslušný formulář na hlavní stránce webu.
Pomocí tlačítka Soubor vyberte požadovaný dokument, zadejte hlavní jazyk textu, výstupního formátu, poté počkejte, až soubor ke stažení a klepněte na příkaz Převést.
- Na konci procesu digitalizace klepněte na tlačítko "Stáhnout výstupní soubor" pro uložení hotového dokumentu s textem v počítači.
Pro oprávněné uživatele je posloupnost akcí poněkud odlišná.
- Použijte tlačítko "Registrovat" nebo "Přihlášení" v panelu horní nabídky, v tomto pořadí, vytvořte bezplatný online účet OCR nebo jděte k němu.
- Po autorizaci v panelu rozpoznávání, podržením tlačítka "Ctrl", vyberte z navrhovaného seznamu až dva jazyky zdrojového dokumentu.
- Zadejte další parametry extrakce textu z PDF a klepněte na tlačítko Vybrat soubor pro stažení dokumentu do služby.
Poté pokračujte s rozpoznáním, klepněte na tlačítko "Převést".
- Na konci zpracování dokumentu klikněte na odkaz nazvaný výstupní soubor ve vhodném sloupci.
Výsledek rozpoznávání bude okamžitě uložen do paměti počítače.
Pokud je to nutné, odstraňte text z malého dokumentu PDF, může být bezpečný pro použití výše popsaného nástroje. Chcete-li pracovat s objemnými soubory, budete muset koupit další znaky ve volném online OCR nebo uchýlit se k jinému řešení.
Metoda 3: NewOcr
Plně bezplatná služba OCR, která umožňuje extrahovat text z téměř jakýchkoli grafických a elektronických dokumentů, jako je DJVU a PDF. Zdroj neukládá omezení velikosti a počtu rozpoznatelných souborů, nevyžaduje registraci a nabízí širokou škálu souvisejících funkcí.
NewOCried podporuje 106 jazyků a může správně zpracovávat i skenování dokumentů s nízkou kvalitou. Na stránce souboru je možné ručně zvolit oblast rozpoznávání textu.
Online služba Newocr.
- Takže můžete začít pracovat s prostředkem okamžitě, aniž byste museli provádět další akce.
Přímo na hlavní stránce je formulář pro import dokumentu na webu. Chcete-li stáhnout soubor v NewOCrite, použijte tlačítko Vybrat soubor v části Vybrat souboru. Pak v poli "Rozpoznávání jazyk (S)" zadejte jeden nebo více jazyků zdrojového dokumentu a klepněte na tlačítko "Upload + OCR".
- Určete nastavení preferovaných rozpoznávání, vyberte požadovanou stránku pro načtení textu a klikněte na tlačítko OCR.
- Přejděte dolů na stránku mírně nižší a vyhledejte tlačítko "Stáhnout".
Klikněte na něj a v rozevíracím seznamu vyberte požadovaný formát dokumentu ke stažení. Poté bude hotový soubor s extrahovaným textem stažen do počítače.
Nástroj je pohodlný a docela dobře rozpoznává všechny znaky. Zpracování každé stránky importovaného dokumentu PDF však musí být spuštěno samostatně a zobrazí se v samostatném souboru. Samozřejmě můžete okamžitě kopírovat výsledky rozpoznávání do schránky a kombinovat je s ostatními.
Nicméně, vzhledem k výše popsanému nuanci, velké objemy textu pomocí NewokoCtion extrahovat velmi obtížné. S malými soubory, Service Copeses "s třeskem."
Metoda 4: Ocr.Space
Jednoduchý a srozumitelný zdroj pro digitalizaci textu vám umožní rozpoznat dokumenty PDF a výstup výsledku do souboru TXT. Žádné limity na počtu stránek nejsou poskytnuty. Jediným omezením je velikost vstupního dokumentu by neměl překročit 5 megabajtů.
Online služba Ocr.Space.
- Nemusíte se zaregistrovat do práce s nástrojem.
Stačí kliknout na odkaz výše a stáhnout dokument PDF na web z počítače pomocí tlačítka "Vybrat soubor" nebo ze sítě odkazem.
- V rozevíracím seznamu Vybrat jazyk OCR vyberte jazyk importovaného dokumentu.
Poté spusťte proces rozpoznávání textu klepnutím na tlačítko "Start OCR!".
- Na konci zpracování souborů naleznete v výsledku v oblasti výsledku OCR a klepněte na tlačítko "Stáhnout" pro stažení dokončeného dokumentu TXT.
Pokud právě potřebujete extrahovat text z PDF a zároveň finální formátování není důležité vůbec, Ocr.Space je dobrou volbou. Jediný, dokument musí být "jednorázový", protože rozpoznání dvou nebo více jazyků současně ve službě není poskytnuta.
Přečtěte si také: FineReader bezplatné analogy
Vyhodnocení online nástrojů uvedených v článku je třeba poznamenat, že FineReader online od aplikace ABBYY je nejpřesnější a kvalitativně s funkcí OCR. Pokud jste pro vás důležití maximální deformita rozpoznávání textu, je nejlepší zvážit konkrétně tuto možnost. Ale budou s největší pravděpodobností platit za něj.
Pokud potřebujete digitalizaci malých dokumentů a jste připraveni správně správné služby služby, doporučuje se používat NewOCr, Ocr.Space nebo zdarma online OCR.