Kā atpazīt PDF failu tiešsaistē

Anonim

Kā atpazīt PDF failu tiešsaistē

Jūs ne vienmēr varat noņemt tekstu no PDF faila, izmantojot parasto kopēšanas metodi. Bieži vien šādu dokumentu lapas ir papīra opciju skenētais saturs. Lai pārvērstu tādus failus, lai pilnībā rediģētu teksta datus, ar optisko rakstzīmju atpazīšanas (OCR) funkciju izmanto īpašas programmas.

Šādi lēmumi ir ļoti sarežģīti pārdošanas apjomi, un tāpēc pastāv ievērojama nauda. Ja nepieciešamība pēc teksta atpazīšanas ar PDF jūs regulāri rodas, tas būs diezgan ieteicams iegādāties atbilstošu programmu. Retos gadījumos viens no pieejamajiem tiešsaistes pakalpojumiem ar līdzīgām iezīmēm būs loģiskākas.

Kā atpazīt tekstu ar PDF tiešsaistē

Protams, kopums OCR tiešsaistes pakalpojumu, salīdzinot ar pilntiesīgu darbvirsmas risinājumiem, ir ierobežots. Bet ir iespējams strādāt ar šādiem resursiem vai pilnīgi bez maksas vai par simbolisku maksu. Galvenais ir tas, ka ar tās galveno uzdevumu, proti, ar teksta atzīšanu, atbilstošās tīmekļa lietojumprogrammas tiks galā, kā arī.

1. metode: ABBYY FineReader Online

Pakalpojumu attīstītājs uzņēmums ir viens no līderiem dokumentu optiskās atzīšanas jomā. ABBYY FineReader for Windows un Mac ir spēcīgs risinājums, lai pārveidotu PDF tekstu un turpmāku darbu ar to.

Programmas tīmekļa analogs, protams, ir zemāks par to ar funkcionalitāti. Tomēr pakalpojums var atpazīt skenēšanas un fotogrāfiju tekstu vairāk nekā 190 valodās. Atbalstīja PDF failu konvertēšanu uz Word, Excel dokumentiem utt.

Tiešsaistes pakalpojums ABBYY FineReader tiešsaistē

  1. Pirms sākat strādāt ar rīku, izveidojiet kontu vietnē vai piesakieties ar Facebook, Google vai Microsoft kontu.

    Reģistrācija tiešsaistes pakalpojumā ABBYY FineReader Online

    Lai pārietu uz atļaujas logu, augšējā izvēlņu panelī noklikšķiniet uz pogas "Pieteikšanās".

  2. Piesakoties, importējiet vēlamo PDF dokumentu FineReader, izmantojot pogu "Lejupielādēt failus".

    Teksta atpazīšana no PDF dokumenta tiešsaistes pakalpojumā ABBYY FineReader tiešsaistē

    Pēc tam noklikšķiniet uz "Izvēlieties Page Numbers" un norādiet vēlamo plaisu, lai atpazītu tekstu.

  3. Pēc tam atlasiet dokumentā esošās valodas, iznākuma faila formātu un noklikšķiniet uz pogas "Atpazīt".

    Teksta atpazīšanas sākums no PDF dokumenta ABBYY FineReader tiešsaistē

  4. Pēc apstrādes, kuras ilgums ir pilnībā atkarīgs no dokumenta daudzuma, jūs varat lejupielādēt gatavu failu ar teksta datiem, vienkārši noklikšķinot uz tās nosaukuma.

    Gatavā dokumenta lejupielāde no tiešsaistes pakalpojuma ABBYY FineReader tiešsaistē

    Vai nu eksportēt to uz vienu no pieejamajiem mākonis pakalpojumiem.

Pakalpojums, iespējams, ir visprecīzākais teksta atpazīšanas algoritms attēlos un PDF failos. Bet, diemžēl, tā brīva lietošana ir ierobežota līdz piecām pārstrādātām lapām mēnesī. Lai strādātu ar vairāk apjomīgiem dokumentiem, jums būs iegādāties gada abonementu.

Tomēr, ja OCR funkcija ir nepieciešama diezgan reti, ABBYY FineReader Online ir lieliska iespēja iegūt tekstu no maziem PDF failiem.

2. metode: bezmaksas tiešsaistes OCR

Vienkāršs un ērts teksts digitalizācija tekstu. Bez nepieciešamības reģistrēties, resurss ļauj atpazīt 15 pilnas PDF lapas stundā. Bezmaksas Online OCR pilnībā darbojas ar dokumentiem 46 valodās un bez atļaujas atbalsta trīs teksta eksportu - Docx, XLSX un TXT.

Reģistrējoties, lietotājs saņem iespēju apstrādāt daudzlapu dokumentus, tomēr bezmaksas šo lapu skaits ir ierobežots līdz 50 vienībām.

Tiešsaistes pakalpojums bezmaksas tiešsaistes OCR

  1. Lai atpazītu tekstu no PDF kā "viesis" bez atļaujas uz resursu, izmantojiet atbilstošo veidlapu galvenajā lapā vietnes.

    PDF atpazīšana tiešsaistes bezmaksas tiešsaistē OCR

    Izvēlieties vajadzīgo dokumentu, izmantojot pogu File, norādiet teksta galveno valodu, izvades formātu, tad gaidiet failu, lai lejupielādētu un noklikšķiniet uz Konvertēt.

  2. Digitalizācijas procesa beigās noklikšķiniet uz "Lejupielādēt izejas failu", lai saglabātu gatavo dokumentu ar datora tekstu.

    Teksta atpazīšanas rezultātu ielāde ar PDF no bezmaksas tiešsaistes OCR Online Service

Attiecībā uz pilnvarotajiem lietotājiem darbības secība ir nedaudz atšķirīga.

  1. Izmantojiet pogu "Reģistrēties" vai "Pieteikšanās" top izvēlņu panelī, attiecīgi izveidojiet bezmaksas tiešsaistes OCR kontu vai dodieties uz to.

    Konta izveide tiešsaistes bezmaksas tiešsaistes OCR

  2. Pēc atļaujas atpazīšanas panelī, turot "Ctrl" taustiņu, izvēlieties līdz divām valodas no avota dokumenta no ierosinātā saraksta.

    Definīcija valodu avota dokumenta teksta atpazīšanai brīvā tiešsaistes OCR

  3. Norādiet papildu teksta ekstrakcijas parametrus no PDF un noklikšķiniet uz pogas Atlasīt failu, lai lejupielādētu dokumentu pakalpojumam.

    PDF dokumentu atpazīšanas sākums tiešsaistes pakalpojumā Free Online OCR

    Tad, lai turpinātu atpazīstamību, noklikšķiniet uz "Konvertēt".

  4. Dokumenta apstrādes beigās noklikšķiniet uz saites, ko sauc par izejas failu attiecīgajā kolonnā.

    Gatavās DOCX faila lejupielāde no bezmaksas tiešsaistes OCR tiešsaistes pakalpojuma

    Atzīšanas rezultāts nekavējoties tiks saglabāts datora atmiņā.

Ja nepieciešams, noņemiet tekstu no neliela PDF dokumenta, var būt droši izmantot iepriekš aprakstīto rīku. Lai strādātu ar apjomīgiem failiem, jums būs jāpērk papildu rakstzīmes bezmaksas tiešsaistē OCR vai izmantot citu risinājumu.

3. metode: Newocr

Pilnībā bezmaksas OCR pakalpojums, kas ļauj iegūt tekstu no gandrīz jebkuriem grafiskiem un elektroniskiem dokumentiem, piemēram, DJVU un PDF. Resurss neparedz ierobežojumus attiecībā uz izmēru un skaitu atpazīstamo failu, neprasa reģistrāciju un piedāvā plašu saistīto funkciju klāstu.

Newocr atbalsta 106 valodas un var pareizi apstrādāt pat zemas kvalitātes skenēšanu dokumentus. Ir iespējams manuāli izvēlēties teksta atpazīšanas apgabalu failu lapā.

Tiešsaistes pakalpojums Newocr

  1. Tātad, jūs varat sākt strādāt ar resursu nekavējoties, bez nepieciešamības veikt papildu darbības.

    PDF faila ielāde, lai atpazītu tiešsaistes pakalpojumu Newocr

    Tieši galvenajā lapā ir veidlapa, lai importētu dokumentu vietnei. Lai lejupielādētu failu NewoC, izmantojiet pogu Select File izvēlieties sadaļu. Tad "atpazīšanas valoda (-s)" laukā, norādiet vienu vai vairākus avota dokumentu valodas, un pēc tam noklikšķiniet uz "Augšupielādēt + OCR".

  2. Norādiet vēlamo atpazīšanas iestatījumus, izvēlieties vajadzīgo lapu, lai ielādētu tekstu un noklikšķiniet uz pogas OCR.

    Teksta atpazīšanas iestatīšana un uzsākšana ar PDF tiešsaistes pakalpojumā Newocr

  3. Ritiniet lejup pa lapu nedaudz zemāku un atrodiet pogu "Lejupielādēt".

    Lejupielādējiet NewoCl tekstu datorā

    Noklikšķiniet uz tā un nolaižamajā sarakstā, izvēlieties vajadzīgo dokumenta formātu, lai lejupielādētu. Pēc tam pabeigtais fails ar iegūto tekstu tiks lejupielādēts datorā.

Šis rīks ir ērts un labi atpazīst visas rakstzīmes. Tomēr katras importētās PDF dokumenta lapas apstrāde jāsāk neatkarīgi un tiek parādīts atsevišķā failā. Protams, jūs varat nekavējoties kopēt atpazīšanas rezultātus starpliktuvē un apvienot tos ar citiem.

Tomēr, ņemot vērā iepriekš aprakstīto niansi, lielie teksta apjomi, kas izmanto NewoCh, lai iegūtu ļoti sarežģītu. Ar maziem failiem, pakalpojuma policistiem "ar sprādzienu"

4. metode: OCR.Space

Vienkāršs un saprotams resurss teksta digitalizācijai ļauj atpazīt PDF dokumentus un izvadīt rezultātu txt failā. Nav norādīti lappušu skaita ierobežojumi. Vienīgais ierobežojums ir izejas dokumenta lielums nedrīkst pārsniegt 5 megabaitus.

Tiešsaistes pakalpojums OCR.Space

  1. Jums nav nepieciešams reģistrēties darbam ar rīku.

    Importējiet PDF failu tiešsaistes OCR.Space pakalpojumā

    Vienkārši noklikšķiniet uz saites iepriekš un lejupielādēt PDF dokumentu uz vietni no datora, izmantojot pogu "Atlasīt failu" vai no tīkla ar atsauci.

  2. Select OCR valodas nolaižamajā sarakstā atlasiet importētā dokumenta valodu.

    PDF dokumentu atpazīšanas procesa izmantošana tiešsaistes pakalpojumā OCR.Space

    Pēc tam palaidiet teksta atpazīšanas procesu, noklikšķinot uz pogas "Start OCR!".

  3. Failu apstrādes beigās skatiet rezultātu laukā OCRD un noklikšķiniet uz "Download", lai lejupielādētu gatavo TXT dokumentu.

    Lejupielādējot PDF failu atpazīšanas rezultātu no OCR.Space tiešsaistes pakalpojuma

Ja jums vienkārši ir nepieciešams iegūt tekstu no PDF, un tajā pašā laikā galīgais formatējums nav svarīgi vispār, OCR.Space ir laba izvēle. Vienīgais, dokumentam jābūt "vienreizējai runai", jo nav sniegta divu vai vairāku valodu atzīšana vienlaicīgi pakalpojumā.

Lasiet arī: FineReader bezmaksas analogus

Novērtējot rakstā esošos tiešsaistes instrumentus, jāatzīmē, ka FineReader tiešsaistē no ABBYY ir visprecīzākais un kvalitatīvi ar OCR funkciju. Ja jums ir svarīgi, lai teksta atpazīšanas maksimālā deformācija vislabāk ir uzskatīt par konkrētu šo iespēju. Bet viņi, visticamāk, maksāsim par viņu.

Ja jums ir nepieciešama nelielu dokumentu digitalizācija, un jūs esat gatavi pareizi pareizi labot pakalpojuma kļūdas, ir ieteicams izmantot Newocr, OCR.Space vai Free Online OCR.

Lasīt vairāk