Ինչպես ճանաչել PDF ֆայլը առցանց

Միթե միշտ չէ, որ կարող եք հեռացնել տեքստը PDF ֆայլից, օգտագործելով Copy Copy մեթոդը: Հաճախ, նման փաստաթղթերի էջերը իրենց թղթի ընտրանքների սկանավորված բովանդակությունն են: Նման ֆայլերը լիովին խմբագրվող տեքստային տվյալներին վերափոխելու համար հատուկ ծրագրեր են օգտագործվում օպտիկական բնույթի ճանաչման (OCR) գործառույթով:

Նման որոշումները շատ բարդ են վաճառքում եւ, հետեւաբար, կան զգալի գումարներ: Եթե PDF- ի հետ տեքստի ճանաչման անհրաժեշտությունը պարբերաբար առաջանում է, ապա շատ խորհուրդ կտա համապատասխան ծրագիր գնել: Հազվագյուտ դեպքերի համար նման հատկություններ ունեցող մատչելի առցանց ծառայություններից մեկը ավելի տրամաբանական կլինի:

Ինչպես ճանաչել տեքստը PDF առցանց

Իհարկե, OCR առցանց ծառայությունների մի շարք, որոնք համեմատած աշխատասեղանի լիարժեք լուծումների համեմատ, ավելի սահմանափակ են: Բայց հնարավոր է աշխատել նման ռեսուրսների կամ ամբողջովին անվճար կամ խորհրդանշական վճարի: Հիմնական բանը, որ իր հիմնական խնդիրն է, մասնավորապես, տեքստի ճանաչմամբ, համապատասխան վեբ ծրագրերը նույնպես կհավաքվեն:

Մեթոդ 1: ABBYY FINEREADER օնլայն

Ծառայության մշակողի ընկերությունը փաստաթղթերի օպտիկական ճանաչման ոլորտի առաջատարներից մեկն է: Windows- ի եւ Mac- ի ABBYY Finereader- ը հզոր լուծում է PDF- ին տեքստի վերափոխելու եւ դրա հետ հետագա աշխատելու համար:

Ծրագրի վեբ անալոգը, իհարկե, դրանից զիջում է գործառույթներով: Այնուամենայնիվ, ծառայությունը կարող է ճանաչել տեքստը սկանավորումներից եւ լուսանկարներից ավելի քան 190 լեզուներով: Աջակցված PDF ֆայլի վերափոխմանը `բառի, գերազանց փաստաթղթերի եւ այլն:

Առցանց ծառայություն Abby Finereader օնլայն

Նախքան գործիքի հետ աշխատելը, ստեղծեք հաշիվ կայքում կամ մուտք գործեք Facebook- ի, Google- ի կամ Microsoft- ի հաշվին:

Լիցենզիայի պատուհանի գնալու համար կտտացրեք «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում:
Մուտք գործելով, ներմուծեք ցանկալի PDF փաստաթուղթը FineReader- ում, օգտագործելով «Ներբեռնեք ֆայլերը» կոճակը:

Այնուհետեւ կտտացրեք «Ընտրեք էջի համարները» եւ նշեք ցանկալի բացը `տեքստը ճանաչելու համար:
Հաջորդը, ընտրեք փաստաթղթում առկա լեզուները, արդյունքի ֆայլի ձեւաչափը եւ կտտացրեք «Rec անաչեք» կոճակը:
Վերամշակելուց հետո, որի տեւողությունը լիովին կախված է փաստաթղթի քանակից, կարող եք ներբեռնել պատրաստի ֆայլ տեքստի տվյալներով `պարզապես սեղմելով նրա անունը:

Կամ այն արտահանեք մատչելի ամպային ծառայություններից մեկը:

Ծառայությունը, հավանաբար, պատկերների եւ PDF ֆայլերի վերաբերյալ տեքստի ճանաչման առավել ճշգրիտ ալգորիթմներն են: Բայց, ցավոք, դրա անվճար օգտագործումը սահմանափակվում է ամսական հինգ վերամշակված էջերով: Ավելի մեծ թվով փաստաթղթերով աշխատելու համար հարկավոր է տարեկան բաժանորդագրություն գնել:

Այնուամենայնիվ, եթե OCR գործառույթը անհրաժեշտ է բավականին հազվադեպ, ABBYY Finereader- ը հիանալի տարբերակ է `փոքր PDF ֆայլերից տեքստը հանելու համար:

Մեթոդ 2. Անվճար առցանց OCR

Պարզ եւ հարմար տեքստի թվայնացնող տեքստ: Առանց գրանցման անհրաժեշտության, ռեսուրսը թույլ է տալիս ճանաչել ժամում 15 լրիվ PDF էջ: Անվճար առցանց OCR- ն ամբողջությամբ աշխատում է փաստաթղթերի հետ 46 լեզուներով եւ առանց թույլտվության աջակցում է երեք տեքստի արտահանում `Docx, XLSX եւ TXT:

Գրանցվելիս օգտագործողը հնարավորություն է ստանում մշակել բազմաֆունկցիոնալ փաստաթղթերը, սակայն այս էջերի անվճար թիվը սահմանափակվում է 50 միավորով:

Առցանց ծառայություն անվճար առցանց ocr

PDF- ից տեքստը ճանաչել որպես «հյուր», առանց ռեսուրսի թույլտվության, օգտագործեք համապատասխան ձեւը կայքի հիմնական էջում:

Ընտրեք ցանկալի փաստաթուղթը `օգտագործելով ֆայլի կոճակը, նշեք տեքստի հիմնական լեզուն, ելքային ձեւաչափը, ապա սպասեք ֆայլը ներբեռնելու եւ կտտացնելու համար:
Թվայնացման գործընթացի ավարտին կտտացրեք «Ներբեռնեք ելքային ֆայլը» `պատրաստի փաստաթուղթը համակարգչում պահելու համար:

Լիազորված օգտագործողների համար գործողությունների հաջորդականությունը փոքր-ինչ տարբեր է:

Օգտագործեք «Գրանցվել» կամ «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում, համապատասխանաբար, ստեղծեք անվճար առցանց OCR հաշիվ կամ գնացեք դրան:
Recognition անկման վահանակում թույլտվությունից հետո «CTRL» ստեղնը պահելը, առաջարկվող ցուցակից ընտրեք աղբյուրի փաստաթղթի մինչեւ երկու լեզուն:
Նշեք PDF- ի հետագա տեքստի արդյունահանման պարամետրերը եւ կտտացրեք Ընտրել File կոճակը `փաստաթուղթը ծառայության ներբեռնելու համար:

Այնուհետեւ, ճանաչելու համար, կտտացրեք «Փոխարկել»:
Փաստաթղթի վերամշակման ավարտին կտտացրեք համապատասխան սյունակում ելքային ֆայլը կոչվող հղմանը:

Recognition անաչման արդյունքը անմիջապես կփրկվի ձեր համակարգչի հիշողության մեջ:

Անհրաժեշտության դեպքում փոքր PDF փաստաթղթից տեքստը հեռացրեք, կարող է անվտանգ լինել վերեւում նկարագրված գործիքի օգտագործման համար: Ծավալուն ֆայլերով աշխատելու համար դուք պետք է անվճար առցանց OCR- ի անվճար նիշ գնել կամ մեկ այլ լուծման դիմում:

Մեթոդ 3: Նյուոկ

Լիովին անվճար OCR ծառայություն, որը թույլ է տալիս տեքստը հանել գրեթե ցանկացած գրաֆիկական եւ էլեկտրոնային փաստաթղթերից, ինչպիսիք են DjVu- ն եւ PDF- ը: Ռեսուրսը չի սահմանում ճանաչելի ֆայլերի չափի եւ քանակի սահմանափակումներ, չի պահանջում գրանցում եւ առաջարկում է հարակից գործառույթների լայն շրջանակ:

Նյուոկը պաշտպանում է 106 լեզուներ եւ կարող է ճիշտ մշակել փաստաթղթերի նույնիսկ ցածրորակ սկաներ: Հնարավոր է ձեռքով ընտրել տեքստի ճանաչման տարածքը ֆայլի էջում:

Առցանց ծառայություն Նյուոկոկ

Այսպիսով, դուք կարող եք անմիջապես սկսել ռեսուրսի հետ աշխատել, առանց լրացուցիչ գործողություններ կատարելու անհրաժեշտության:

Հիմնական էջում ճիշտ է կայքը փաստաթուղթ ներմուծելու ձեւ: Նյուոկում ֆայլը ներբեռնելու համար օգտագործեք Ընտրել ֆայլի կոճակը ընտրեք ձեր ֆայլի բաժնում: Այնուհետեւ «Recognition Language (S)» դաշտում նշեք մեկ կամ մի քանի աղբյուրի լեզուներ, ապա կտտացրեք «Վերբեռնեք + OCR»:
Նշեք ձեր նախընտրած ճանաչման պարամետրերը, ընտրեք ցանկալի էջը `տեքստը առնելու եւ OCR կոճակը կտտացնելու համար:
Ոլորեք էջը մի փոքր ցածր եւ գտեք «Ներբեռնումը» կոճակը:

Կտտացրեք այն եւ բացվող ցուցակի մեջ, ընտրեք փաստաթղթի ցանկալի ձեւաչափը ներբեռնելու համար: Դրանից հետո արդյունահանված տեքստով պատրաստի ֆայլը ներբեռնվի ձեր համակարգչում:

Գործիքը հարմար է եւ բավականին լավ ճանաչում է բոլոր նիշերը: Այնուամենայնիվ, ներմուծվող PDF փաստաթղթի յուրաքանչյուր էջի վերամշակումը պետք է գործարկվի ինքնուրույն եւ ցուցադրվի առանձին ֆայլում: Դուք կարող եք, իհարկե, անմիջապես պատճենեք ճանաչման արդյունքները clipboard- ում եւ դրանք համատեղեք ուրիշների հետ:

Այնուամենայնիվ, հաշվի առնելով վերը նկարագրված նրբերանգը, նորոկը, օգտագործելով Նյուբեռն, շատ դժվար է: Փոքր ֆայլերով ծառայությունը «խոպոպով» դիմեց:

Մեթոդ 4. OCR.Space

Տեքստի թվայնացման պարզ եւ հասկանալի ռեսուրսը թույլ է տալիս ճանաչել PDF փաստաթղթերը եւ արդյունքը դուրս բերել TXT ֆայլում: Էջերի քանակի սահմաններ չեն տրամադրվում: Միակ սահմանափակումը մուտքային փաստաթղթի չափն է, չպետք է գերազանցի 5 մեգաբայթ:

Առցանց ծառայություն OCR.Space

Անհրաժեշտ չէ գրանցվել գործիքի հետ աշխատելու համար:

Պարզապես կտտացրեք վերը նշված հղմանը եւ համակարգչից ներբեռնեք PDF փաստաթուղթը համակարգչից `օգտագործելով« Ընտրեք ֆայլ »կոճակը կամ ցանցից` հղումով:
Ընտրել OCR Լեզուն ներքեւի ցուցակում ընտրեք ներմուծվող փաստաթղթի լեզուն:

Այնուհետեւ գործարկեք տեքստի ճանաչման գործընթացը `կտտացնելով« Սկսել OCR »կոճակը:
Ֆայլի վերամշակման ավարտին տես արդյունքը ocr'ed արդյունքի դաշտում եւ կտտացրեք «Ներբեռնումը», պատրաստի txt փաստաթուղթը ներբեռնելու համար:

Եթե պարզապես անհրաժեշտ է տեքստը հանել PDF- ից եւ միեւնույն ժամանակ, վերջնական ձեւաչափումը ընդհանրապես կարեւոր չէ, ocr.space- ը լավ ընտրություն է: Միակ, փաստաթուղթը պետք է լինի «միակողմանի», քանի որ ծառայության մեջ միաժամանակ միաժամանակ չի տրամադրվում երկու կամ ավելի լեզուների ճանաչում:

Կարդացեք նաեւ. Ֆիներեք անվճար կոմպլեմենտար անալոգներ

Հոդվածում ներկայացված առցանց գործիքների գնահատումը պետք է նշել, որ ABBYY- ից առցանց առցանց լուսանկարը առավել ճշգրիտ եւ որակյալ է OCR գործառույթով: Եթե ձեզ համար կարեւոր եք տեքստի ճանաչման առավելագույն դեֆորմացիան, ամենալավն է հատուկ դիտարկել այս տարբերակը: Բայց նրանք, ամենայն հավանականությամբ, կվճարեն նրա համար:

Եթե Ձեզ անհրաժեշտ է փոքր փաստաթղթերի թվայնացում, եւ պատրաստ եք շտկել ծառայության սխալները, խորհուրդ է տրվում օգտագործել Newock, OCR.Space կամ անվճար առցանց OCR: