Ինչպես ճանաչել PDF ֆայլը առցանց

Anonim

Ինչպես ճանաչել PDF ֆայլը առցանց

Միթե միշտ չէ, որ կարող եք հեռացնել տեքստը PDF ֆայլից, օգտագործելով Copy Copy մեթոդը: Հաճախ, նման փաստաթղթերի էջերը իրենց թղթի ընտրանքների սկանավորված բովանդակությունն են: Նման ֆայլերը լիովին խմբագրվող տեքստային տվյալներին վերափոխելու համար հատուկ ծրագրեր են օգտագործվում օպտիկական բնույթի ճանաչման (OCR) գործառույթով:

Նման որոշումները շատ բարդ են վաճառքում եւ, հետեւաբար, կան զգալի գումարներ: Եթե ​​PDF- ի հետ տեքստի ճանաչման անհրաժեշտությունը պարբերաբար առաջանում է, ապա շատ խորհուրդ կտա համապատասխան ծրագիր գնել: Հազվագյուտ դեպքերի համար նման հատկություններ ունեցող մատչելի առցանց ծառայություններից մեկը ավելի տրամաբանական կլինի:

Ինչպես ճանաչել տեքստը PDF առցանց

Իհարկե, OCR առցանց ծառայությունների մի շարք, որոնք համեմատած աշխատասեղանի լիարժեք լուծումների համեմատ, ավելի սահմանափակ են: Բայց հնարավոր է աշխատել նման ռեսուրսների կամ ամբողջովին անվճար կամ խորհրդանշական վճարի: Հիմնական բանը, որ իր հիմնական խնդիրն է, մասնավորապես, տեքստի ճանաչմամբ, համապատասխան վեբ ծրագրերը նույնպես կհավաքվեն:

Մեթոդ 1: ABBYY FINEREADER օնլայն

Ծառայության մշակողի ընկերությունը փաստաթղթերի օպտիկական ճանաչման ոլորտի առաջատարներից մեկն է: Windows- ի եւ Mac- ի ABBYY Finereader- ը հզոր լուծում է PDF- ին տեքստի վերափոխելու եւ դրա հետ հետագա աշխատելու համար:

Ծրագրի վեբ անալոգը, իհարկե, դրանից զիջում է գործառույթներով: Այնուամենայնիվ, ծառայությունը կարող է ճանաչել տեքստը սկանավորումներից եւ լուսանկարներից ավելի քան 190 լեզուներով: Աջակցված PDF ֆայլի վերափոխմանը `բառի, գերազանց փաստաթղթերի եւ այլն:

Առցանց ծառայություն Abby Finereader օնլայն

  1. Նախքան գործիքի հետ աշխատելը, ստեղծեք հաշիվ կայքում կամ մուտք գործեք Facebook- ի, Google- ի կամ Microsoft- ի հաշվին:

    Գրանցում առցանց ծառայության ABBYY Finereader առցանց

    Լիցենզիայի պատուհանի գնալու համար կտտացրեք «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում:

  2. Մուտք գործելով, ներմուծեք ցանկալի PDF փաստաթուղթը FineReader- ում, օգտագործելով «Ներբեռնեք ֆայլերը» կոճակը:

    Տեքստի ճանաչում PDF փաստաթղթից առցանց ծառայության ABBYY Finereader առցանց

    Այնուհետեւ կտտացրեք «Ընտրեք էջի համարները» եւ նշեք ցանկալի բացը `տեքստը ճանաչելու համար:

  3. Հաջորդը, ընտրեք փաստաթղթում առկա լեզուները, արդյունքի ֆայլի ձեւաչափը եւ կտտացրեք «Rec անաչեք» կոճակը:

    Տեքստի ճանաչման սկիզբ PDF- ի փաստաթղթից ABBYY Finereader- ում առցանց

  4. Վերամշակելուց հետո, որի տեւողությունը լիովին կախված է փաստաթղթի քանակից, կարող եք ներբեռնել պատրաստի ֆայլ տեքստի տվյալներով `պարզապես սեղմելով նրա անունը:

    Ավարտված փաստաթուղթ ներբեռնել առցանց ծառայությունից ABBYY Finereader առցանց

    Կամ այն ​​արտահանեք մատչելի ամպային ծառայություններից մեկը:

Ծառայությունը, հավանաբար, պատկերների եւ PDF ֆայլերի վերաբերյալ տեքստի ճանաչման առավել ճշգրիտ ալգորիթմներն են: Բայց, ցավոք, դրա անվճար օգտագործումը սահմանափակվում է ամսական հինգ վերամշակված էջերով: Ավելի մեծ թվով փաստաթղթերով աշխատելու համար հարկավոր է տարեկան բաժանորդագրություն գնել:

Այնուամենայնիվ, եթե OCR գործառույթը անհրաժեշտ է բավականին հազվադեպ, ABBYY Finereader- ը հիանալի տարբերակ է `փոքր PDF ֆայլերից տեքստը հանելու համար:

Մեթոդ 2. Անվճար առցանց OCR

Պարզ եւ հարմար տեքստի թվայնացնող տեքստ: Առանց գրանցման անհրաժեշտության, ռեսուրսը թույլ է տալիս ճանաչել ժամում 15 լրիվ PDF էջ: Անվճար առցանց OCR- ն ամբողջությամբ աշխատում է փաստաթղթերի հետ 46 լեզուներով եւ առանց թույլտվության աջակցում է երեք տեքստի արտահանում `Docx, XLSX եւ TXT:

Գրանցվելիս օգտագործողը հնարավորություն է ստանում մշակել բազմաֆունկցիոնալ փաստաթղթերը, սակայն այս էջերի անվճար թիվը սահմանափակվում է 50 միավորով:

Առցանց ծառայություն անվճար առցանց ocr

  1. PDF- ից տեքստը ճանաչել որպես «հյուր», առանց ռեսուրսի թույլտվության, օգտագործեք համապատասխան ձեւը կայքի հիմնական էջում:

    PDF ճանաչում առցանց անվճար առցանց OCR

    Ընտրեք ցանկալի փաստաթուղթը `օգտագործելով ֆայլի կոճակը, նշեք տեքստի հիմնական լեզուն, ելքային ձեւաչափը, ապա սպասեք ֆայլը ներբեռնելու եւ կտտացնելու համար:

  2. Թվայնացման գործընթացի ավարտին կտտացրեք «Ներբեռնեք ելքային ֆայլը» `պատրաստի փաստաթուղթը համակարգչում պահելու համար:

    Տեքստի ճանաչման արդյունքների բեռնումը PDF- ի անվճար առցանց OCR առցանց ծառայությունից

Լիազորված օգտագործողների համար գործողությունների հաջորդականությունը փոքր-ինչ տարբեր է:

  1. Օգտագործեք «Գրանցվել» կամ «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում, համապատասխանաբար, ստեղծեք անվճար առցանց OCR հաշիվ կամ գնացեք դրան:

    Ստեղծում է հաշիվ առցանց անվճար առցանց OCR

  2. Recognition անկման վահանակում թույլտվությունից հետո «CTRL» ստեղնը պահելը, առաջարկվող ցուցակից ընտրեք աղբյուրի փաստաթղթի մինչեւ երկու լեզուն:

    Տեքստի ճանաչման աղբյուրի փաստաթղթի լեզուների սահմանում Անվճար առցանց OCR

  3. Նշեք PDF- ի հետագա տեքստի արդյունահանման պարամետրերը եւ կտտացրեք Ընտրել File կոճակը `փաստաթուղթը ծառայության ներբեռնելու համար:

    PDF փաստաթղթերի ճանաչման սկիզբ առցանց ծառայության անվճար առցանց OCR

    Այնուհետեւ, ճանաչելու համար, կտտացրեք «Փոխարկել»:

  4. Փաստաթղթի վերամշակման ավարտին կտտացրեք համապատասխան սյունակում ելքային ֆայլը կոչվող հղմանը:

    Ներբեռնեք ավարտված Docx ֆայլը անվճար առցանց OCR առցանց ծառայությունից

    Recognition անաչման արդյունքը անմիջապես կփրկվի ձեր համակարգչի հիշողության մեջ:

Անհրաժեշտության դեպքում փոքր PDF փաստաթղթից տեքստը հեռացրեք, կարող է անվտանգ լինել վերեւում նկարագրված գործիքի օգտագործման համար: Ծավալուն ֆայլերով աշխատելու համար դուք պետք է անվճար առցանց OCR- ի անվճար նիշ գնել կամ մեկ այլ լուծման դիմում:

Մեթոդ 3: Նյուոկ

Լիովին անվճար OCR ծառայություն, որը թույլ է տալիս տեքստը հանել գրեթե ցանկացած գրաֆիկական եւ էլեկտրոնային փաստաթղթերից, ինչպիսիք են DjVu- ն եւ PDF- ը: Ռեսուրսը չի սահմանում ճանաչելի ֆայլերի չափի եւ քանակի սահմանափակումներ, չի պահանջում գրանցում եւ առաջարկում է հարակից գործառույթների լայն շրջանակ:

Նյուոկը պաշտպանում է 106 լեզուներ եւ կարող է ճիշտ մշակել փաստաթղթերի նույնիսկ ցածրորակ սկաներ: Հնարավոր է ձեռքով ընտրել տեքստի ճանաչման տարածքը ֆայլի էջում:

Առցանց ծառայություն Նյուոկոկ

  1. Այսպիսով, դուք կարող եք անմիջապես սկսել ռեսուրսի հետ աշխատել, առանց լրացուցիչ գործողություններ կատարելու անհրաժեշտության:

    PDF ֆայլը բեռնելու համար Newock առցանց ծառայությունը ճանաչելու համար

    Հիմնական էջում ճիշտ է կայքը փաստաթուղթ ներմուծելու ձեւ: Նյուոկում ֆայլը ներբեռնելու համար օգտագործեք Ընտրել ֆայլի կոճակը ընտրեք ձեր ֆայլի բաժնում: Այնուհետեւ «Recognition Language (S)» դաշտում նշեք մեկ կամ մի քանի աղբյուրի լեզուներ, ապա կտտացրեք «Վերբեռնեք + OCR»:

  2. Նշեք ձեր նախընտրած ճանաչման պարամետրերը, ընտրեք ցանկալի էջը `տեքստը առնելու եւ OCR կոճակը կտտացնելու համար:

    Newock առցանց ծառայության մեջ PDF- ի հետ տեքստային ճանաչման կարգավորում եւ գործարկում

  3. Ոլորեք էջը մի փոքր ցածր եւ գտեք «Ներբեռնումը» կոճակը:

    Ներբեռնեք Նյուոկի տեքստում համակարգչում

    Կտտացրեք այն եւ բացվող ցուցակի մեջ, ընտրեք փաստաթղթի ցանկալի ձեւաչափը ներբեռնելու համար: Դրանից հետո արդյունահանված տեքստով պատրաստի ֆայլը ներբեռնվի ձեր համակարգչում:

Գործիքը հարմար է եւ բավականին լավ ճանաչում է բոլոր նիշերը: Այնուամենայնիվ, ներմուծվող PDF փաստաթղթի յուրաքանչյուր էջի վերամշակումը պետք է գործարկվի ինքնուրույն եւ ցուցադրվի առանձին ֆայլում: Դուք կարող եք, իհարկե, անմիջապես պատճենեք ճանաչման արդյունքները clipboard- ում եւ դրանք համատեղեք ուրիշների հետ:

Այնուամենայնիվ, հաշվի առնելով վերը նկարագրված նրբերանգը, նորոկը, օգտագործելով Նյուբեռն, շատ դժվար է: Փոքր ֆայլերով ծառայությունը «խոպոպով» դիմեց:

Մեթոդ 4. OCR.Space

Տեքստի թվայնացման պարզ եւ հասկանալի ռեսուրսը թույլ է տալիս ճանաչել PDF փաստաթղթերը եւ արդյունքը դուրս բերել TXT ֆայլում: Էջերի քանակի սահմաններ չեն տրամադրվում: Միակ սահմանափակումը մուտքային փաստաթղթի չափն է, չպետք է գերազանցի 5 մեգաբայթ:

Առցանց ծառայություն OCR.Space

  1. Անհրաժեշտ չէ գրանցվել գործիքի հետ աշխատելու համար:

    Ներմուծեք PDF ֆայլ առցանց OCR.Space ծառայության մեջ

    Պարզապես կտտացրեք վերը նշված հղմանը եւ համակարգչից ներբեռնեք PDF փաստաթուղթը համակարգչից `օգտագործելով« Ընտրեք ֆայլ »կոճակը կամ ցանցից` հղումով:

  2. Ընտրել OCR Լեզուն ներքեւի ցուցակում ընտրեք ներմուծվող փաստաթղթի լեզուն:

    PDF փաստաթղթերի ճանաչման գործընթացը գործարկել առցանց ծառայության OCR.Space- ում

    Այնուհետեւ գործարկեք տեքստի ճանաչման գործընթացը `կտտացնելով« Սկսել OCR »կոճակը:

  3. Ֆայլի վերամշակման ավարտին տես արդյունքը ocr'ed արդյունքի դաշտում եւ կտտացրեք «Ներբեռնումը», պատրաստի txt փաստաթուղթը ներբեռնելու համար:

    PDF ֆայլի ճանաչման արդյունքը ներբեռնելով OCR.Space առցանց ծառայությունից

Եթե ​​պարզապես անհրաժեշտ է տեքստը հանել PDF- ից եւ միեւնույն ժամանակ, վերջնական ձեւաչափումը ընդհանրապես կարեւոր չէ, ocr.space- ը լավ ընտրություն է: Միակ, փաստաթուղթը պետք է լինի «միակողմանի», քանի որ ծառայության մեջ միաժամանակ միաժամանակ չի տրամադրվում երկու կամ ավելի լեզուների ճանաչում:

Կարդացեք նաեւ. Ֆիներեք անվճար կոմպլեմենտար անալոգներ

Հոդվածում ներկայացված առցանց գործիքների գնահատումը պետք է նշել, որ ABBYY- ից առցանց առցանց լուսանկարը առավել ճշգրիտ եւ որակյալ է OCR գործառույթով: Եթե ​​ձեզ համար կարեւոր եք տեքստի ճանաչման առավելագույն դեֆորմացիան, ամենալավն է հատուկ դիտարկել այս տարբերակը: Բայց նրանք, ամենայն հավանականությամբ, կվճարեն նրա համար:

Եթե ​​Ձեզ անհրաժեշտ է փոքր փաստաթղթերի թվայնացում, եւ պատրաստ եք շտկել ծառայության սխալները, խորհուրդ է տրվում օգտագործել Newock, OCR.Space կամ անվճար առցանց OCR:

Կարդալ ավելին