Միթե միշտ չէ, որ կարող եք հեռացնել տեքստը PDF ֆայլից, օգտագործելով Copy Copy մեթոդը: Հաճախ, նման փաստաթղթերի էջերը իրենց թղթի ընտրանքների սկանավորված բովանդակությունն են: Նման ֆայլերը լիովին խմբագրվող տեքստային տվյալներին վերափոխելու համար հատուկ ծրագրեր են օգտագործվում օպտիկական բնույթի ճանաչման (OCR) գործառույթով:
Նման որոշումները շատ բարդ են վաճառքում եւ, հետեւաբար, կան զգալի գումարներ: Եթե PDF- ի հետ տեքստի ճանաչման անհրաժեշտությունը պարբերաբար առաջանում է, ապա շատ խորհուրդ կտա համապատասխան ծրագիր գնել: Հազվագյուտ դեպքերի համար նման հատկություններ ունեցող մատչելի առցանց ծառայություններից մեկը ավելի տրամաբանական կլինի:
Ինչպես ճանաչել տեքստը PDF առցանց
Իհարկե, OCR առցանց ծառայությունների մի շարք, որոնք համեմատած աշխատասեղանի լիարժեք լուծումների համեմատ, ավելի սահմանափակ են: Բայց հնարավոր է աշխատել նման ռեսուրսների կամ ամբողջովին անվճար կամ խորհրդանշական վճարի: Հիմնական բանը, որ իր հիմնական խնդիրն է, մասնավորապես, տեքստի ճանաչմամբ, համապատասխան վեբ ծրագրերը նույնպես կհավաքվեն:Մեթոդ 1: ABBYY FINEREADER օնլայն
Ծառայության մշակողի ընկերությունը փաստաթղթերի օպտիկական ճանաչման ոլորտի առաջատարներից մեկն է: Windows- ի եւ Mac- ի ABBYY Finereader- ը հզոր լուծում է PDF- ին տեքստի վերափոխելու եւ դրա հետ հետագա աշխատելու համար:
Ծրագրի վեբ անալոգը, իհարկե, դրանից զիջում է գործառույթներով: Այնուամենայնիվ, ծառայությունը կարող է ճանաչել տեքստը սկանավորումներից եւ լուսանկարներից ավելի քան 190 լեզուներով: Աջակցված PDF ֆայլի վերափոխմանը `բառի, գերազանց փաստաթղթերի եւ այլն:
Առցանց ծառայություն Abby Finereader օնլայն
- Նախքան գործիքի հետ աշխատելը, ստեղծեք հաշիվ կայքում կամ մուտք գործեք Facebook- ի, Google- ի կամ Microsoft- ի հաշվին:
Լիցենզիայի պատուհանի գնալու համար կտտացրեք «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում:
- Մուտք գործելով, ներմուծեք ցանկալի PDF փաստաթուղթը FineReader- ում, օգտագործելով «Ներբեռնեք ֆայլերը» կոճակը:
Այնուհետեւ կտտացրեք «Ընտրեք էջի համարները» եւ նշեք ցանկալի բացը `տեքստը ճանաչելու համար:
- Հաջորդը, ընտրեք փաստաթղթում առկա լեզուները, արդյունքի ֆայլի ձեւաչափը եւ կտտացրեք «Rec անաչեք» կոճակը:
- Վերամշակելուց հետո, որի տեւողությունը լիովին կախված է փաստաթղթի քանակից, կարող եք ներբեռնել պատրաստի ֆայլ տեքստի տվյալներով `պարզապես սեղմելով նրա անունը:
Կամ այն արտահանեք մատչելի ամպային ծառայություններից մեկը:
Ծառայությունը, հավանաբար, պատկերների եւ PDF ֆայլերի վերաբերյալ տեքստի ճանաչման առավել ճշգրիտ ալգորիթմներն են: Բայց, ցավոք, դրա անվճար օգտագործումը սահմանափակվում է ամսական հինգ վերամշակված էջերով: Ավելի մեծ թվով փաստաթղթերով աշխատելու համար հարկավոր է տարեկան բաժանորդագրություն գնել:
Այնուամենայնիվ, եթե OCR գործառույթը անհրաժեշտ է բավականին հազվադեպ, ABBYY Finereader- ը հիանալի տարբերակ է `փոքր PDF ֆայլերից տեքստը հանելու համար:
Մեթոդ 2. Անվճար առցանց OCR
Պարզ եւ հարմար տեքստի թվայնացնող տեքստ: Առանց գրանցման անհրաժեշտության, ռեսուրսը թույլ է տալիս ճանաչել ժամում 15 լրիվ PDF էջ: Անվճար առցանց OCR- ն ամբողջությամբ աշխատում է փաստաթղթերի հետ 46 լեզուներով եւ առանց թույլտվության աջակցում է երեք տեքստի արտահանում `Docx, XLSX եւ TXT:
Գրանցվելիս օգտագործողը հնարավորություն է ստանում մշակել բազմաֆունկցիոնալ փաստաթղթերը, սակայն այս էջերի անվճար թիվը սահմանափակվում է 50 միավորով:
Առցանց ծառայություն անվճար առցանց ocr
- PDF- ից տեքստը ճանաչել որպես «հյուր», առանց ռեսուրսի թույլտվության, օգտագործեք համապատասխան ձեւը կայքի հիմնական էջում:
Ընտրեք ցանկալի փաստաթուղթը `օգտագործելով ֆայլի կոճակը, նշեք տեքստի հիմնական լեզուն, ելքային ձեւաչափը, ապա սպասեք ֆայլը ներբեռնելու եւ կտտացնելու համար:
- Թվայնացման գործընթացի ավարտին կտտացրեք «Ներբեռնեք ելքային ֆայլը» `պատրաստի փաստաթուղթը համակարգչում պահելու համար:
Լիազորված օգտագործողների համար գործողությունների հաջորդականությունը փոքր-ինչ տարբեր է:
- Օգտագործեք «Գրանցվել» կամ «Մուտք» կոճակը լավագույն ընտրացանկի վահանակում, համապատասխանաբար, ստեղծեք անվճար առցանց OCR հաշիվ կամ գնացեք դրան:
- Recognition անկման վահանակում թույլտվությունից հետո «CTRL» ստեղնը պահելը, առաջարկվող ցուցակից ընտրեք աղբյուրի փաստաթղթի մինչեւ երկու լեզուն:
- Նշեք PDF- ի հետագա տեքստի արդյունահանման պարամետրերը եւ կտտացրեք Ընտրել File կոճակը `փաստաթուղթը ծառայության ներբեռնելու համար:
Այնուհետեւ, ճանաչելու համար, կտտացրեք «Փոխարկել»:
- Փաստաթղթի վերամշակման ավարտին կտտացրեք համապատասխան սյունակում ելքային ֆայլը կոչվող հղմանը:
Recognition անաչման արդյունքը անմիջապես կփրկվի ձեր համակարգչի հիշողության մեջ:
Անհրաժեշտության դեպքում փոքր PDF փաստաթղթից տեքստը հեռացրեք, կարող է անվտանգ լինել վերեւում նկարագրված գործիքի օգտագործման համար: Ծավալուն ֆայլերով աշխատելու համար դուք պետք է անվճար առցանց OCR- ի անվճար նիշ գնել կամ մեկ այլ լուծման դիմում:
Մեթոդ 3: Նյուոկ
Լիովին անվճար OCR ծառայություն, որը թույլ է տալիս տեքստը հանել գրեթե ցանկացած գրաֆիկական եւ էլեկտրոնային փաստաթղթերից, ինչպիսիք են DjVu- ն եւ PDF- ը: Ռեսուրսը չի սահմանում ճանաչելի ֆայլերի չափի եւ քանակի սահմանափակումներ, չի պահանջում գրանցում եւ առաջարկում է հարակից գործառույթների լայն շրջանակ:
Նյուոկը պաշտպանում է 106 լեզուներ եւ կարող է ճիշտ մշակել փաստաթղթերի նույնիսկ ցածրորակ սկաներ: Հնարավոր է ձեռքով ընտրել տեքստի ճանաչման տարածքը ֆայլի էջում:
Առցանց ծառայություն Նյուոկոկ
- Այսպիսով, դուք կարող եք անմիջապես սկսել ռեսուրսի հետ աշխատել, առանց լրացուցիչ գործողություններ կատարելու անհրաժեշտության:
Հիմնական էջում ճիշտ է կայքը փաստաթուղթ ներմուծելու ձեւ: Նյուոկում ֆայլը ներբեռնելու համար օգտագործեք Ընտրել ֆայլի կոճակը ընտրեք ձեր ֆայլի բաժնում: Այնուհետեւ «Recognition Language (S)» դաշտում նշեք մեկ կամ մի քանի աղբյուրի լեզուներ, ապա կտտացրեք «Վերբեռնեք + OCR»:
- Նշեք ձեր նախընտրած ճանաչման պարամետրերը, ընտրեք ցանկալի էջը `տեքստը առնելու եւ OCR կոճակը կտտացնելու համար:
- Ոլորեք էջը մի փոքր ցածր եւ գտեք «Ներբեռնումը» կոճակը:
Կտտացրեք այն եւ բացվող ցուցակի մեջ, ընտրեք փաստաթղթի ցանկալի ձեւաչափը ներբեռնելու համար: Դրանից հետո արդյունահանված տեքստով պատրաստի ֆայլը ներբեռնվի ձեր համակարգչում:
Գործիքը հարմար է եւ բավականին լավ ճանաչում է բոլոր նիշերը: Այնուամենայնիվ, ներմուծվող PDF փաստաթղթի յուրաքանչյուր էջի վերամշակումը պետք է գործարկվի ինքնուրույն եւ ցուցադրվի առանձին ֆայլում: Դուք կարող եք, իհարկե, անմիջապես պատճենեք ճանաչման արդյունքները clipboard- ում եւ դրանք համատեղեք ուրիշների հետ:
Այնուամենայնիվ, հաշվի առնելով վերը նկարագրված նրբերանգը, նորոկը, օգտագործելով Նյուբեռն, շատ դժվար է: Փոքր ֆայլերով ծառայությունը «խոպոպով» դիմեց:
Մեթոդ 4. OCR.Space
Տեքստի թվայնացման պարզ եւ հասկանալի ռեսուրսը թույլ է տալիս ճանաչել PDF փաստաթղթերը եւ արդյունքը դուրս բերել TXT ֆայլում: Էջերի քանակի սահմաններ չեն տրամադրվում: Միակ սահմանափակումը մուտքային փաստաթղթի չափն է, չպետք է գերազանցի 5 մեգաբայթ:
Առցանց ծառայություն OCR.Space
- Անհրաժեշտ չէ գրանցվել գործիքի հետ աշխատելու համար:
Պարզապես կտտացրեք վերը նշված հղմանը եւ համակարգչից ներբեռնեք PDF փաստաթուղթը համակարգչից `օգտագործելով« Ընտրեք ֆայլ »կոճակը կամ ցանցից` հղումով:
- Ընտրել OCR Լեզուն ներքեւի ցուցակում ընտրեք ներմուծվող փաստաթղթի լեզուն:
Այնուհետեւ գործարկեք տեքստի ճանաչման գործընթացը `կտտացնելով« Սկսել OCR »կոճակը:
- Ֆայլի վերամշակման ավարտին տես արդյունքը ocr'ed արդյունքի դաշտում եւ կտտացրեք «Ներբեռնումը», պատրաստի txt փաստաթուղթը ներբեռնելու համար:
Եթե պարզապես անհրաժեշտ է տեքստը հանել PDF- ից եւ միեւնույն ժամանակ, վերջնական ձեւաչափումը ընդհանրապես կարեւոր չէ, ocr.space- ը լավ ընտրություն է: Միակ, փաստաթուղթը պետք է լինի «միակողմանի», քանի որ ծառայության մեջ միաժամանակ միաժամանակ չի տրամադրվում երկու կամ ավելի լեզուների ճանաչում:
Կարդացեք նաեւ. Ֆիներեք անվճար կոմպլեմենտար անալոգներ
Հոդվածում ներկայացված առցանց գործիքների գնահատումը պետք է նշել, որ ABBYY- ից առցանց առցանց լուսանկարը առավել ճշգրիտ եւ որակյալ է OCR գործառույթով: Եթե ձեզ համար կարեւոր եք տեքստի ճանաչման առավելագույն դեֆորմացիան, ամենալավն է հատուկ դիտարկել այս տարբերակը: Բայց նրանք, ամենայն հավանականությամբ, կվճարեն նրա համար:
Եթե Ձեզ անհրաժեշտ է փոքր փաստաթղթերի թվայնացում, եւ պատրաստ եք շտկել ծառայության սխալները, խորհուրդ է տրվում օգտագործել Newock, OCR.Space կամ անվճար առցանց OCR: