A PDF fájl online felismerése

Anonim

A PDF fájl online felismerése

Nem mindig távolítsa el a szöveget a PDF fájlból a szokásos másolási módszerrel. Gyakran az ilyen dokumentumok oldalai a papírbeállítások beolvasott tartalma. Az ilyen fájlok teljes körű szerkeszthető szöveges adatainak konvertálásához speciális programokat használnak az optikai karakterfelismerés (OCR) funkcióval.

Az ilyen döntések nagyon összetettek az értékesítésben, és ezért jelentős pénz. Ha a szövegfelismerés szükségessége rendszeresen felmerül, akkor meglehetősen ajánlatos lesz a megfelelő program megvásárlása. A ritka esetekben a rendelkezésre álló online szolgáltatások egyike logikusabb lesz.

Hogyan ismerjük fel a szöveget PDF-vel

Természetesen az OCR online szolgáltatások jellemzői, a teljes körű asztali megoldásokhoz képest korlátozottabbak. De lehetséges az ilyen erőforrásokkal való együttműködés, vagy teljesen szabad vagy szimbolikus díj. A legfontosabb dolog az, hogy fő feladata, nevezetesen a szöveg elismerésével a megfelelő webes alkalmazások is megbirkóznak.

1. módszer: ABBYY FineReader Online

A szolgáltatásfejlesztő cég az egyik vezetője a dokumentumok optikai elismerésének területén. ABBYY FineReader for Windows és Mac egy erőteljes megoldás a PDF szöveges átalakítására, és tovább dolgozik vele.

Természetesen a program webes analógja gyengébb a funkcionalitással. Mindazonáltal a szolgáltatás több mint 190 nyelven felismerheti a szkennelést és fényképeket. Támogatott PDF fájlváltás szóra, Excel dokumentumokra stb.

Online szolgáltatás ABBYY FineReader Online

  1. Mielőtt elkezdené dolgozni egy eszközzel, hozzon létre egy fiókot a webhelyen, vagy jelentkezzen be a Facebook, a Google vagy a Microsoft fiókjával.

    Regisztráció az online szolgáltatás ABBYY FineReader Online

    Az Engedélyezési ablakba való lépéshez kattintson a felső menü panelen a "Bejelentkezés" gombra.

  2. A bejelentkezéssel importálja a kívánt PDF-dokumentumot a finereaderben, a "Fájlok letöltése" gomb segítségével.

    Szövegfelismerés a PDF dokumentumból az Online Service ABBYY FineReader Online

    Ezután kattintson a "Oldalszámok kiválasztása" gombra, és adja meg a kívánt különbséget a szöveg felismeréséhez.

  3. Ezután válassza ki a dokumentumban jelen lévő nyelveket, az eredményfájlformátumot, és kattintson az "Felismerés" gombra.

    A szövegfelismerés kezdete PDF dokumentumból az ABBYY FineReader online

  4. A feldolgozás után, amelynek időtartama attól függ, hogy mennyi a dokumentum, akkor töltse le a kész fájl szöveges adatok egyszerűen a nevére kattintva.

    Kész dokumentum letöltése az Online Service ABBYY FineReader Online

    Vagy exportálja azt az elérhető felhőszolgáltatásoknak.

A szolgáltatás valószínűleg a legpontosabb szövegfelismerési algoritmusok a képeken és a PDF fájlokon. De sajnos ingyenes felhasználása havonta öt feldolgozott oldalra korlátozódik. A többfunkciós dokumentumokkal való együttműködésnek éves előfizetést kell vásárolnia.

Ha azonban az OCR funkcióra nagyon ritkán van szükség, az ABBYY FineReader online kiváló lehetőség a kis PDF fájlok szövegének kivonására.

2. módszer: ingyenes online OCR

Egyszerű és kényelmes szöveg digitalizáló szöveg. Anélkül, hogy regisztrálnunk kell, az erőforrás lehetővé teszi, hogy 15 teljes PDF oldalt felismerjen óránként. Ingyenes online OCR teljesen működik a 46 nyelvű dokumentumokkal, és engedély nélkül támogatja a három szöveges exportot - DOCX, XLSX és TXT.

A regisztráció során a felhasználó lehetőséget kap arra, hogy többoldalas dokumentumokat dolgozzon ki, de ezeknek az oldalaknak a szabadszáma 50 egységre korlátozódik.

Online szolgáltatás ingyenes online OCR

  1. A PDF-től "Vendég" szövegként való felismerése, az erőforrás engedély nélkül, használja a megfelelő űrlapot a webhely főoldalán.

    PDF felismerése az online ingyenes online OCR

    Válassza ki a kívánt dokumentumot a Fájl gombra, adja meg a legfőbb szöveg nyelvét, kimeneti formátumot, majd várjon a fájl letöltése és kattintson a Konvertálás.

  2. A digitalizációs folyamat végén kattintson a "Kimeneti fájl letöltése" gombra, hogy mentse a kész dokumentumot a számítógép szövegével.

    Text felismerési eredmények betöltése PDF-vel az ingyenes online OCR online szolgáltatásból

Az engedélyezett felhasználók számára a cselekvések sorrendje kissé eltérő.

  1. Használja a "Regisztráció" vagy "Bejelentkezés" gombot a felső menüpanelen, hogy hozzon létre egy ingyenes online OCR-fiókot, vagy menjen hozzá.

    Fiók létrehozása az online ingyenes online OCR-ben

  2. Az elismerési panel engedélyezése után a "Ctrl" billentyűt tartva válassza ki a forrásdokumentum két nyelvét a javasolt listából.

    A forrásdokumentum nyelvének meghatározása a szövegfelismeréshez az ingyenes online OCR-ben

  3. Adja meg a további szöveges kitermelési paramétereket a PDF-ről, és kattintson a Fájl kiválasztása gombra a dokumentum letöltéséhez.

    A PDF dokumentum elismerése az online szolgáltatás ingyenes online OCR

    Ezután folytassa az elismerést, kattintson az "Konvertálás" gombra.

  4. A dokumentum feldolgozása végén kattintson a megfelelő oszlopban lévő kimeneti fájl nevű linkre.

    A kész Docx fájl letöltése az ingyenes online OCR online szolgáltatásból

    Az elismerés eredménye azonnal menthető a számítógép memóriájába.

Szükség esetén távolítsa el a szöveget egy kis PDF-dokumentumból, amely biztonságos lehet a fent leírt eszköz használatára. A nagyszerű fájlok kezeléséhez további karaktereket kell vásárolnia az ingyenes online OCR vagy egy másik megoldáshoz.

3. módszer: Newoc

Teljesen ingyenes OCR szolgáltatás, amely lehetővé teszi a szöveg szinte bármilyen grafikus és elektronikus dokumentumokból, mint a DJVU és a PDF. Az erőforrás nem írja elő korlátozásokat a felismerhető fájlok méretére és számára, nem igényel regisztrációt, és széles körű kapcsolódó funkciókat kínál.

A Newoc támogatja a 106 nyelvet, és megfelelően feldolgozhatja a dokumentumok alacsony minőségű beolvasását. Lehetőség van manuálisan kiválasztani a szövegfelismerő területet a fájloldalon.

Online szolgáltatás Newoc

  1. Tehát azonnal elkezdheti az erőforrással való munkát, anélkül, hogy szükség lenne extra intézkedések végrehajtására.

    A PDF fájl betöltése az online szolgáltatás újbóli felismeréséhez

    A főoldalon van egy dokumentum egy dokumentum behozatalára a webhelyre. Töltse le a fájlt NewOCR, használja a Fájl kiválasztása gombra a kívánt fájl listájában. Ezután az "Felismerési nyelv (ek) mezőben adjon meg egy vagy több forrású dokumentumnyelvet, majd kattintson a" + OCR "gombra.

  2. Adja meg a kívánt felismerési beállításokat, válassza ki a kívánt oldalt a szöveg letöltéséhez, majd kattintson az OCR gombra.

    A szövegfelismerés beállítása és elindítása PDF-vel az online szolgáltatásban

  3. Lapozzunk le az oldalon kissé alacsonyabb és keresse meg a "Download" gombot.

    Letöltés Learned in Newct szöveg a számítógépen

    Kattintson rá, és a legördülő listában válassza ki a letöltendő dokumentum kívánt formátumát. Ezt követően a kész fájlt a kivont szöveggel tölti le a számítógépre.

A szerszám kényelmes és elég jól felismeri az összes karaktert. Az importált PDF-dokumentum minden oldalának feldolgozását azonban függetlenül kell elindítani, és külön fájlban jelenik meg. Természetesen azonnal másolja az elismerést a vágólapra, és egyesítse őket másokkal.

Mindazonáltal, tekintettel a fent leírt árnyalatú, nagy mennyiségű szöveg, a Newoc használatával, hogy nagyon nehéz legyen. A kis fájlok, a szolgáltatáscsomag "egy bang".

4. módszer: OCR.Space

A szöveg digitalizálásához egyszerű és érthető erőforrás lehetővé teszi a PDF dokumentumok felismerését és a TXT fájl eredményét. Nincs korlátozás az oldalak számában nincs megadva. Az egyetlen korlátozás a bemeneti dokumentum mérete nem haladhatja meg az 5 megabájtot.

Online szolgáltatás OCR.Space

  1. Nem kell regisztrálnia a szerszámmal való munkához.

    PDF fájl importálása az Online OCR.Space szolgáltatásban

    Csak kattintson a fenti linkre, és töltse le a PDF dokumentumot a webhelyre a számítógépről a "Fájl kiválasztása" gomb vagy a hálózaton keresztül.

  2. A Válassza ki az OCR nyelv legördülő listáját, válassza ki az importált dokumentum nyelvét.

    A PDF dokumentum felismerési folyamata az Online Service OCR.Space

    Ezután futtassa a szövegfelismerési folyamatot a "START OCR!" Gomb megnyomásával.

  3. A fájlfeldolgozás végén olvassa el az OCR 'eredmény mező eredményét, és kattintson a "Letöltés" gombra a kész TXT dokumentum letöltéséhez.

    A PDF fájl felismerésének eredménye az OCR.Space online szolgáltatásból

Ha csak meg kell kivonat szöveget a PDF és ugyanakkor a végső formázás ez egyáltalán nem fontos, Ocr.Space egy jó választás. Az egyetlen, a dokumentumnak "egyszemélyesnek" kell lennie, mivel a szolgáltatásban egyidejűleg két vagy több nyelv elismerése nincs megadva.

Olvassa el: FineReader ingyenes analógok

A cikkben bemutatott online eszközök értékelését meg kell jegyezni, hogy az ABBYY-tól online online a legfinomabb és minőségi szempontból az OCR funkció. Ha fontos a szövegfelismerés maximális deformitásához, akkor a legjobb, ha kifejezetten ezt a lehetőséget fontolgatja. De valószínűleg fizetnek neki.

Ha szüksége van digitalizálása kis dokumentumok, és készen áll, hogy helyesen megfelelő szolgáltatás hibák, célszerű használni NewOCR, Ocr.Space vagy ingyenes online OCR.

Olvass tovább