Jinsi ya kutambua faili ya PDF online.

Anonim

Jinsi ya kutambua faili ya PDF online.

Huwezi daima kuondoa maandishi kutoka kwenye faili ya PDF kwa kutumia njia ya kawaida ya nakala. Mara nyingi, kurasa za nyaraka hizo ni maudhui yaliyopigwa ya chaguzi zao za karatasi. Ili kubadilisha faili hizo kwa data ya maandishi kamili, programu maalum hutumiwa na kazi ya kutambua tabia ya Optical (OCR).

Maamuzi hayo ni ngumu sana katika mauzo na kwa hiyo, kuna pesa kubwa. Ikiwa haja ya kutambuliwa kwa maandishi na PDF hutokea mara kwa mara, itakuwa na vyema kabisa kununua mpango sahihi. Kwa matukio ya kawaida, moja ya huduma zilizopo mtandaoni na sifa zinazofanana zitakuwa na mantiki zaidi.

Jinsi ya kutambua maandishi na PDF online

Bila shaka, seti ya vipengele vya huduma za OCR, ikilinganishwa na ufumbuzi kamili wa desktop, ni mdogo zaidi. Lakini inawezekana kufanya kazi na rasilimali hizo au bure kabisa au kwa ada ya mfano. Jambo kuu ni kwamba kwa kazi yake kuu, yaani, kwa kutambuliwa kwa maandiko, maombi yanayofanana ya mtandao yataweza kukabiliana na pia.

Njia ya 1: Abbyy FineReader Online.

Kampuni ya Wasanidi Programu ni mmoja wa viongozi katika uwanja wa kutambuliwa kwa nyaraka. Finereader ya Abbyy kwa Windows na Mac ni suluhisho la nguvu la kubadilisha PDF kwa maandishi na kazi zaidi nayo.

Analog ya wavuti ya programu, bila shaka, ni duni kwa hiyo kwa utendaji. Hata hivyo, huduma inaweza kutambua maandiko kutoka kwa scans na picha katika lugha zaidi ya 190. Msaada wa faili ya PDF kwa neno, nyaraka za Excel, nk.

Huduma ya Online Abbyy FineReader Online.

  1. Kabla ya kuanza kufanya kazi na chombo, uunda akaunti kwenye tovuti au ingia na akaunti ya Facebook, Google au Microsoft.

    Usajili katika huduma ya mtandaoni Abbyy FineReader online

    Ili kwenda kwenye dirisha la idhini, bofya kitufe cha "Login" kwenye jopo la juu la menyu.

  2. Kwa kuingia ndani, ingiza hati ya PDF inayohitajika katika FineReader, ukitumia kitufe cha "Download Files".

    Kutambua Nakala kutoka hati ya PDF katika huduma ya mtandaoni Abbyy FineReader online

    Kisha bofya "Chagua namba za ukurasa" na ueleze pengo la taka ili kutambua maandishi.

  3. Kisha, chagua lugha zilizopo kwenye waraka, faili ya faili ya matokeo na bonyeza kitufe cha "kutambua".

    Kuanza kwa kutambuliwa kwa maandishi kutoka kwa hati ya PDF katika Abby Finereader online

  4. Baada ya usindikaji, muda ambao unategemea kabisa kiasi cha hati, unaweza kupakua faili iliyopangwa tayari na data ya maandishi kwa kubonyeza jina lake.

    Kupakua hati iliyokamilishwa kutoka kwa huduma ya mtandaoni Abbyy FineReader online

    Ama kuuza nje kwa moja ya huduma za wingu zilizopo.

Huduma hiyo labda ni algorithms ya kutambua maandishi sahihi kwenye picha na faili za PDF. Lakini, kwa bahati mbaya, matumizi yake ya bure ni mdogo kwa kurasa za kusindika tano kwa mwezi. Kufanya kazi na nyaraka nyingi zaidi, utahitaji kununua usajili wa kila mwaka.

Hata hivyo, kama kazi ya OCR inahitajika mara chache, Abbyy FineReader online ni chaguo bora ya kuondoa maandishi kutoka kwa faili ndogo za PDF.

Njia ya 2: Free Online OCR.

Nakala rahisi na rahisi ya maandiko ya digitizing. Bila ya haja ya kujiandikisha, rasilimali inakuwezesha kutambua kurasa kamili za PDF kwa saa. Free online OCR inafanya kazi kikamilifu na nyaraka katika lugha 46 na bila idhini inasaidia mauzo ya maandishi matatu - DOCX, XLSX na TXT.

Wakati wa kusajili, mtumiaji anapata fursa ya kusindika nyaraka nyingi za ukurasa, hata hivyo, idadi ya bure ya kurasa hizi ni mdogo kwa vitengo 50.

Huduma ya mtandaoni Bure Online OCR.

  1. Ili kutambua maandiko kutoka kwa PDF kama "mgeni", bila idhini juu ya rasilimali, tumia fomu inayofaa kwenye ukurasa kuu wa tovuti.

    Kutambua PDF katika Free Online OCR.

    Chagua waraka uliotaka kwa kutumia kifungo cha faili, taja lugha kuu ya maandishi, muundo wa pato, kisha kusubiri faili ya kupakua na bonyeza kubadilisha.

  2. Mwishoni mwa mchakato wa digitization, bofya "Pakua faili ya pato" ili uhifadhi hati iliyokamilishwa na maandishi kwenye kompyuta.

    Inapakia Matokeo ya Utambuzi wa Nakala na PDF kutoka huduma ya mtandaoni ya OCR ya bure

Kwa watumiaji walioidhinishwa, mlolongo wa vitendo ni tofauti kabisa.

  1. Tumia kitufe cha "Daftari" au "Ingia" kwenye jopo la orodha ya juu, kwa mtiririko huo, uunda akaunti ya bure ya OCR au uende.

    Kujenga akaunti katika Online Free Online OCR.

  2. Baada ya idhini katika jopo la kutambua, ukizingatia ufunguo wa "Ctrl", chagua hadi lugha mbili za hati ya chanzo kutoka kwenye orodha iliyopendekezwa.

    Ufafanuzi wa lugha za hati ya chanzo kwa kutambuliwa kwa maandishi katika OCR ya bure ya mtandaoni

  3. Taja vigezo vingine vya uchimbaji wa maandishi kutoka PDF na bofya kifungo cha faili cha kuchagua ili kupakua hati kwa huduma.

    Anza ya utambuzi wa hati ya PDF katika huduma ya mtandaoni Bure Online OCR

    Kisha, kuendelea na kutambuliwa, bofya "Badilisha".

  4. Mwishoni mwa usindikaji wa waraka, bofya kiungo kinachoitwa faili ya pato kwenye safu inayofaa.

    Inapakua faili ya DOCX iliyokamilishwa kutoka kwa huduma ya mtandaoni ya OCR mtandaoni

    Matokeo ya kutambuliwa mara moja kuokolewa kwenye kumbukumbu ya kompyuta yako.

Ikiwa ni lazima, ondoa maandishi kutoka kwa hati ndogo ya PDF inaweza kuwa salama kwa kutumia matumizi ya chombo kilichoelezwa hapo juu. Ili kufanya kazi na faili zenye nguvu, utahitaji kununua wahusika wa ziada katika OCR ya bure ya mtandaoni au mapumziko kwenye suluhisho jingine.

Njia ya 3: NewOCR.

Huduma ya OCR kikamilifu ambayo inakuwezesha kuondoa maandishi kutoka kwa nyaraka za graphic na elektroniki kama DJVU na PDF. Rasilimali haifai vikwazo juu ya ukubwa na idadi ya faili zinazojulikana, hauhitaji usajili na hutoa kazi mbalimbali zinazohusiana.

NewOC inasaidia lugha 106 na inaweza kusindika kwa usahihi hata scans ya chini ya nyaraka. Inawezekana kuchagua eneo la utambuzi wa maandishi kwenye ukurasa wa faili.

Huduma ya mtandaoni NewOC.

  1. Kwa hiyo, unaweza kuanza kufanya kazi na rasilimali mara moja, bila ya haja ya kufanya vitendo vya ziada.

    Inapakia faili ya PDF kutambua huduma ya mtandaoni NewOC.

    Haki kwenye ukurasa kuu kuna fomu ya kuagiza hati kwenye tovuti. Ili kupakua faili huko NewCoc, tumia kitufe cha faili cha kuchagua kwenye sehemu ya faili yako. Kisha katika uwanja wa "lugha (s)", taja lugha moja au zaidi ya chanzo cha chanzo, na kisha bofya "Pakia + OCR".

  2. Taja mipangilio yako ya utambuzi uliopendekezwa, chagua ukurasa unaotaka ili upate maandishi na bofya kifungo cha OCR.

    Kuweka na Kuanzisha Utambuzi wa Nakala na PDF katika huduma ya mtandaoni News

  3. Tembea chini ukurasa kidogo chini na kupata kifungo cha "kupakua".

    Pakua kujifunza katika Nakala mpya kwenye Kompyuta

    Bofya juu yake na kwenye orodha ya kushuka, chagua muundo uliotaka wa hati ili kupakua. Baada ya hapo, faili iliyokamilishwa na maandishi yaliyoondolewa yatapakuliwa kwenye kompyuta yako.

Chombo ni rahisi na kinatambua kabisa wahusika wote. Hata hivyo, usindikaji wa kila ukurasa wa hati ya nje ya PDF inapaswa kuwekwa kwa kujitegemea na kuonyeshwa kwenye faili tofauti. Unaweza, bila shaka, mara moja nakala ya kutambua matokeo katika clipboard na kuchanganya nao na wengine.

Hata hivyo, kutokana na nuance iliyoelezwa hapo juu, kiasi kikubwa cha maandiko kwa kutumia NewOC ili kuchimba ngumu sana. Pamoja na faili ndogo, huduma za huduma "na bang."

Njia ya 4: OCR.Space.

Rasilimali rahisi na inayoeleweka kwa digitization ya maandishi inakuwezesha kutambua nyaraka za PDF na pato matokeo katika faili ya txt. Hakuna mipaka katika idadi ya kurasa haitolewa. Upeo pekee ni ukubwa wa hati ya pembejeo haipaswi kuzidi megabytes 5.

Huduma ya mtandaoni OCR.Space.

  1. Huna haja ya kujiandikisha kufanya kazi na chombo.

    Ingiza faili ya PDF kwenye huduma ya OCR.Space mtandaoni

    Bonyeza tu kwenye kiungo hapo juu na kupakua hati ya PDF kwenye tovuti kutoka kwenye kompyuta ukitumia kitufe cha "Chagua Faili" au kutoka kwenye mtandao kwa kumbukumbu.

  2. Katika orodha ya Drop-Down ya Lugha ya Chagua, chagua lugha ya hati iliyoagizwa.

    Kuendesha mchakato wa kutambuliwa hati ya PDF katika huduma ya mtandaoni ya OCR.Space

    Kisha kukimbia mchakato wa kutambuliwa kwa maandishi kwa kubofya kitufe cha "OCR!".

  3. Mwishoni mwa usindikaji wa faili, angalia matokeo katika uwanja wa matokeo ya OCR'ED na bofya "Pakua" ili kupakua hati ya TXT iliyokamilishwa.

    Kupakua matokeo ya kutambua faili ya PDF kutoka kwa huduma ya OCR.Space Online

Ikiwa unahitaji tu kuondoa maandishi kutoka kwa PDF na wakati huo huo muundo wa mwisho sio muhimu kabisa, OCR.Space ni chaguo nzuri. Moja peke yake, hati lazima iwe "kuongea moja", kwa kuwa kutambua lugha mbili au zaidi wakati huo huo katika huduma haitolewa.

Soma pia: Analogues ya Msingi ya FineReader.

Kuchunguza vyombo vya mtandaoni vinavyowasilishwa katika makala lazima ieleweke kwamba FineReader online kutoka Abbyy ni sahihi zaidi na kwa ubora na kazi ya OCR. Ikiwa wewe ni muhimu kwako uharibifu wa juu wa kutambuliwa kwa maandishi, ni bora kuzingatia hasa chaguo hili. Lakini wao huenda kumlipa.

Ikiwa unahitaji digitization ya nyaraka ndogo na uko tayari kusahihisha makosa ya huduma, inashauriwa kutumia NewOCR, OCR.Space au OCR ya bure ya OCR.

Soma zaidi