Kiel rekoni PDF-dosieron interrete

Anonim

Kiel rekoni PDF-dosieron interrete

Vi ne povas ĉiam forigi la tekston de la PDF-dosiero per la kutima kopio-metodo. Ofte la paĝoj de tiaj dokumentoj estas la skanitaj enhavoj de iliaj paperaj opcioj. Por konverti tiajn dosierojn al plene redakteblaj tekstaj datumoj, specialaj programoj estas uzataj kun la optika karaktero-rekono (OCR) funkcio.

Tiaj decidoj estas tre kompleksaj pri vendoj kaj, tial, estas konsiderinda mono. Se la bezono de teksta agnosko kun PDF vi leviĝas regule, ĝi estos tute konvena aĉeti la taŭgan programon. Por maloftaj kazoj, unu el la disponeblaj interretaj servoj kun similaj ecoj estos pli logika.

Kiel rekoni tekston per PDF-interrete

Kompreneble, aro de trajtoj de OCR-interretaj servoj, kompare kun plenkreskaj labortablaj solvoj, estas pli limigitaj. Sed eblas labori kun tiaj rimedoj aŭ tute libera aŭ por simbola kotizo. La ĉefa afero estas, ke kun ĝia ĉefa tasko, nome, kun la agnosko de la teksto, la respondaj retaj aplikoj ankaŭ eltenos.

Metodo 1: Abbyy FineReader interrete

La serva programisto kompanio estas unu el la gvidantoj en la kampo de optika rekono de dokumentoj. Abbyy FineReader por Vindozo kaj Mac estas potenca solvo por konverti PDF al teksto kaj plue labori kun ĝi.

La retejo analoga de la programo, kompreneble, estas pli malalta ol ĝi de funcionalidad. Tamen, la servo povas rekoni la tekston de skanadoj kaj fotoj en pli ol 190 lingvoj. Subtenita PDF-konvertiĝo al Word, Excel Dokumentoj, ktp.

Enreta Servo Abbyy FineReader interrete

  1. Antaŭ ol vi eklaboras kun ilo, kreu konton en la retejo aŭ ensalutu per Facebook, Google aŭ Microsoft-konto.

    Registrado en la interreta servo Abbyy FineReader interrete

    Por iri al la Permeso-Fenestro, alklaku la butonon "Ensaluti" en la supra menua panelo.

  2. Ensalutante, importu la deziratan PDF-dokumenton en FajneReader, uzante la butonon "Elŝuta Dosieroj".

    Teksta rekono de la PDF-dokumento en la interreta servo Abbyy FineReader interrete

    Tiam alklaku "Elektu Paĝajn Nombrojn" kaj specifu la deziratan mankon por rekoni tekston.

  3. Poste, elektu la lingvojn ĉe la dokumento, la Rezulto-Dosiera Formato kaj alklaku la butonon "Rekoni".

    Komenco de teksta rekono de PDF-dokumento en Abbyy FineReader interrete

  4. Post prilaborado, kies daŭro dependas tute de la kvanto da dokumento, vi povas elŝuti pretan dosieron kun tekstaj datumoj simple per alklako sur ĝia nomo.

    Elŝutante finitan dokumenton de la interreta servo Abbyy FineReader interrete

    Aŭ eksporti ĝin al unu el la disponeblaj nubaj servoj.

La servo estas probable la plej preciza teksta rekono algoritmoj sur bildoj kaj PDF dosieroj. Sed, bedaŭrinde, ĝia libera uzo estas limigita al kvin-prilaboritaj paĝoj monate. Por labori kun pli grandaj dokumentoj, vi devos aĉeti jaran abonon.

Tamen, se la OCR-funkcio necesas sufiĉe malofte, Abbyy FineReader interrete estas bonega eblo ĉerpi tekston de malgrandaj PDF-dosieroj.

Metodo 2: Senpaga Enreta OCR

Simpla kaj konvena teksto cifereciganta tekston. Sen la bezono registriĝi, la rimedo permesas rekoni 15 plenajn PDF-paĝojn hore. Senpaga Online OCR Plene funkcias kun dokumentoj en 46 lingvoj kaj sen rajtigo subtenas tri tekstajn eksportojn - DOCX, XLSX kaj TXT.

Alirinte, la uzanto ricevas la okazon prilabori plur-paĝajn dokumentojn, tamen, la libera nombro de ĉi tiuj paĝoj estas limigita al 50 unuoj.

Enreta Servo Senpaga Enreta ONR

  1. Por rekoni tekston de PDF kiel "gasto", sen rajtigo pri la rimedo, uzu la taŭgan formon sur la ĉefa paĝo de la retejo.

    PDF-Rekono en Online Free Online OCR

    Elektu la deziratan dokumenton per la dosiera butono, specifu la ĉefan lingvon de la teksto, eliga formato, kaj atendu la dosieron por elŝuti kaj alklaki konvertiĝon.

  2. Je la fino de la cifereca procezo, alklaku "Elŝuti Eliran Dosieron" por konservi la finitan dokumenton kun la teksto en la komputilo.

    Ŝarĝante tekstajn Rekonajn rezultojn kun PDF de senpaga interreta OCR-interreta servo

Por la rajtigitaj uzantoj, la sekvenco de agoj estas iom malsama.

  1. Uzu la butonon "Registro" aŭ "Ensalutu" en la supra menuo-panelo al, respektive, kreu senpagan interretan konton OCR aŭ iru al ĝi.

    Krei konton en Online Free Online OCR

  2. Post rajtigo en la agnoska panelo, tenante la klavon CTRL "CTRL, elektu ĝis du lingvojn de la fonta dokumento de la proponita listo.

    Difino de la lingvoj de la fonta dokumento por teksta rekono en senpaga interreta OCR

  3. Indiku pliajn tekstajn eltirajn parametrojn de PDF kaj alklaku la butonon Elektu Dosiero por elŝuti la dokumenton al la servo.

    Komenco de PDF-dokumenta rekono en interreta servo senpage interrete ONR

    Tiam, por daŭrigi per rekono, alklaku "konverti".

  4. Je la fino de la prilaborado de la dokumento, alklaku la ligon nomatan la eliga dosiero en la taŭga kolumno.

    Elŝutante la finitan DOCX-dosieron de la senpaga interreta OCR-interreta servo

    La rezulto de rekono tuj estos konservita en la memoro de via komputilo.

Se necese, forigi tekston de malgranda PDF-dokumento povas esti sekure recurrir al la uzo de la ilo priskribita supre. Por labori kun grandaj dosieroj, vi devos aĉeti pliajn signojn en senpaga interreto OCR aŭ rimedo al alia solvo.

Metodo 3: NewOcr

Plene Senpaga OCR-servo, kiu ebligas al vi ĉerpi tekston de preskaŭ ĉiuj grafikaj kaj elektronikaj dokumentoj kiel DJVU kaj PDF. La rimedo ne trudas restriktojn pri la grandeco kaj nombro de rekoneblaj dosieroj, ne postulas registriĝon kaj ofertas ampleksan gamon de rilataj funkcioj.

NewOcr subtenas 106 lingvojn kaj povas ĝuste prilabori eĉ malmultekostajn skanadojn de dokumentoj. Eblas permane elekti la tekstan rekonan areon en la dosiero-paĝo.

Enreta Servo NewOcr

  1. Do, vi povas komenci labori kun rimedo tuj, sen la bezono plenumi ekstrajn agojn.

    Ŝarĝante la PDF-dosieron por agnoski interretan servon NewOcr

    Uste sur la ĉefa paĝo estas formo por importi dokumenton al la retejo. Por elŝuti la dosieron en NewOcr, uzu la butonon Elektu dosieron en la elektu vian dosieran sekcion. Tiam en la kampo "Rekono-Lingvo (j)", specifu unu aŭ pli da fonto-dokumentaj lingvoj, kaj tiam alklaku "Alŝutu + OCR".

  2. Indiku viajn preferatajn rekonajn agordojn, elektu la deziratan paĝon por ricevi la tekston kaj alklaku la butonon OCR.

    Starigi kaj lanĉi tekstan rekonon per PDF en interreta servo NewOcr

  3. Rulumu laŭ la paĝo iomete pli malalta kaj trovu la butonon "Elŝuti".

    Elŝuti lernita en NewOcr Teksto sur komputilo

    Alklaku ĝin kaj en la falmenuo, elektu la deziratan formaton de la dokumento por elŝuti. Post tio, la finita dosiero kun la eltirita teksto estos elŝutita al via komputilo.

La ilo estas konvena kaj sufiĉe bone rekonas ĉiujn karakterojn. Tamen, la prilaborado de ĉiu paĝo de la importita PDF-dokumento devas esti lanĉita sendepende kaj montriĝas en aparta dosiero. Vi povas, kompreneble, tuj kopii la rekonon rezultigas la tondujo kaj kombini ilin kun aliaj.

Tamen, donita la supre priskribita nuanco, grandaj volumoj de teksto uzante NEWOCR por ĉerpi tre malfacila. Kun la malgrandaj dosieroj, la servo copes "kun eksplodo."

Metodo 4: OCR.Space

Simpla kaj komprenebla rimedo por teksto-ciferecigo permesas al vi rekoni PDF-dokumentojn kaj eligi la rezulton en la TXT-dosiero. Neniuj limoj en la nombro de paĝoj ne estas provizitaj. La sola limigo estas la grandeco de la eniga dokumento ne devus superi 5 megabajtojn.

Enreta Servo OCR.Space

  1. Vi ne bezonas registriĝi por labori kun la ilo.

    Importu PDF-dosieron en interreta servo OCR.Space

    Simple alklaku la supran ligilon kaj elŝutu la PDF-dokumenton al la retejo de la komputilo per la butono "Elektu dosieron" aŭ de la reto per referenco.

  2. En la listo de Lingvo de Select OCR-Lingvo, elektu la lingvon de la importita dokumento.

    Ruli la PDF-dokumentan rekonan procezon en la interreta servo OCR.Space

    Tiam kuri la tekston-rekonan procezon alklakante la butonon "Komenco OCR!".

  3. Je la fino de la prilaborado de dosieroj, vidu la rezulton en la kampo Occ'ed Result kaj alklaku "Elŝuti" por elŝuti la finitan TXT-dokumenton.

    Elŝutante la rezulton de la PDF-dosiero-rekono de la OCR.Space Online Service

Se vi nur bezonas eltiri tekston de PDF kaj samtempe la fina formatado, ĝi tute ne gravas, OCR.Space estas bona elekto. La sola, la dokumento devas esti "unu-parolanta", ĉar la agnosko de du aŭ pli da lingvoj samtempe en la servo ne estas provizita.

Legu ankaŭ: FineReader komplimentaj analogoj

Taksi la retajn instrumentojn prezentitajn en la artikolo devas noti, ke la FajneReader interrete de Abbuy estas plej preciza kaj kvalite kun la OCR-funkcio. Se vi gravas por vi la maksimuma deformeco de la teksta rekono, estas plej bone konsideri specife ĉi tiun opcion. Sed ili plej probable pagos al li.

Se vi bezonas ciferecigon de malgrandaj dokumentoj kaj vi pretas ĝuste korekti servajn erarojn, estas rekomendinde uzi NEWOCR, OCR.Space aŭ senpaga interreta OCR.

Legu pli