თქვენ ყოველთვის არ შეგიძლიათ ამოიღოთ ტექსტი PDF ფაილის გამოყენებით ჩვეულებრივი ასლის მეთოდით. ხშირად, ასეთი დოკუმენტების გვერდები არიან მათი ქაღალდის პარამეტრების დასკანერებული შინაარსი. ასეთი ფაილების სრულად რედაქტირებადი ტექსტური მონაცემების გადასაჭრელად, სპეციალური პროგრამები გამოიყენება ოპტიკური ხასიათის აღიარებით (OCR) ფუნქციით.
ასეთი გადაწყვეტილებები ძალიან რთულია გაყიდვებში და, შესაბამისად, არსებობს მნიშვნელოვანი ფული. თუ PDF- ის ტექსტური აღიარების საჭიროება რეგულარულად წარმოიქმნება, ეს იქნება სათანადო პროგრამის შეძენა. იშვიათი შემთხვევებისთვის, მსგავსი ფუნქციების ერთ-ერთი ხელმისაწვდომი სერვისი უფრო ლოგიკური იქნება.
როგორ აღიაროს ტექსტი PDF ხაზზე
რა თქმა უნდა, OCR- ის ონლაინ სერვისების კომპლექტი, სრულფასოვანი დესკტოპის გადაწყვეტილებებთან შედარებით უფრო შეზღუდულია. მაგრამ შესაძლებელია ასეთი რესურსების ან სრულიად თავისუფალი ან სიმბოლური მოსაკრებლისთვის მუშაობა. მთავარია, რომ მისი ძირითადი ამოცანა, კერძოდ, ტექსტის აღიარებით, შესაბამისი ვებ-პროგრამებიც გაუმკლავდება.მეთოდი 1: Abbyy Finerader ხაზზე
სერვისის დეველოპერული კომპანია ერთ-ერთი ლიდერია დოკუმენტების ოპტიკური აღიარების სფეროში. Abbyy finerader for Windows და Mac არის ძლიერი გადაწყვეტა კონვერტაცია PDF ტექსტი და შემდგომი მუშაობა მასთან.
პროგრამის ვებ ანალოგი, რა თქმა უნდა, მასზე ნაკლებია. მიუხედავად ამისა, სერვისს შეუძლია აღიაროს ტექსტი სკანირებისაგან და ფოტოსურათებისგან 190-ზე მეტ ენაზე. მხარდაჭერილი PDF ფაილის კონვერტაციის სიტყვა, Excel დოკუმენტები და ა.შ.
ონლაინ სერვისი Abbyy Finereader ონლაინ რეჟიმში
- სანამ დაიწყებთ მუშაობას ინსტრუმენტთან, ანგარიშის შექმნა საიტზე ან შეხვიდეთ Facebook- ზე, Google ან Microsoft ანგარიშზე.
ავტორიზაციის ფანჯარაში წასვლა, დააჭირეთ ღილაკს "შესვლა" ზედა მენიუს პანელში.
- შესვლისას, სასურველი PDF დოკუმენტის იმპორტირება Finereader- ში, ღილაკზე "ჩამოტვირთვა ფაილების" გამოყენებით.
შემდეგ დააჭირეთ ღილაკს "აირჩიეთ გვერდი ნომრები" და მიუთითეთ სასურველი უფსკრული ტექსტის აღიარების მიზნით.
- შემდეგი, აირჩიეთ დოკუმენტში წარმოდგენილი ენები, შედეგის ფაილის ფორმატი და დააჭირეთ "აღიარებას" ღილაკს.
- დამუშავების შემდეგ, რომლის ხანგრძლივობა მთლიანად დამოკიდებულია დოკუმენტის ოდენობაზე, შეგიძლიათ ჩამოტვირთოთ მზა ფაილის ტექსტური მონაცემებით მისი სახელით დაწკაპუნებით.
ან ექსპორტის მას ერთი ხელმისაწვდომი Cloud მომსახურება.
სერვისი ალბათ ყველაზე ზუსტ ტექსტურ აღიარებას ალგორითმებს სურათებსა და PDF ფაილებზე. მაგრამ, სამწუხაროდ, მისი თავისუფალი გამოყენება თვეში ხუთი დამუშავებული გვერდია შემოიფარგლება. მეტი მოცულობითი დოკუმენტების მუშაობა, თქვენ უნდა შეიძინოთ წლიური გამოწერა.
თუმცა, თუ OCR ფუნქცია საჭიროა საკმაოდ იშვიათად, Abbyy Finereader Online არის შესანიშნავი ვარიანტი ამონაწერი ტექსტი მცირე PDF ფაილი.
მეთოდი 2: უფასო ონლაინ OCR
მარტივი და მოსახერხებელი ტექსტი ციფრული ტექსტი. რეგისტრაციის გარეშე, რესურსი საშუალებას გაძლევთ აღიაროთ 15 სრული PDF გვერდები საათში. უფასო ონლაინ ocr სრულად მუშაობს დოკუმენტებთან 46 ენაზე და ავტორიზაციის გარეშე მხარს უჭერს სამი ტექსტური ექსპორტი - DOCX, XLSX და TXT.
რეგისტრაციისას, მომხმარებელი იღებს მრავალპროფილიანი დოკუმენტების დამუშავებას, თუმცა, ამ გვერდებზე უფასო ნომერი შემოიფარგლება 50 ერთეულით.
ონლაინ სერვისის უფასო ონლაინ OCR
- PDF- ის ტექსტის აღიარება, როგორც "სტუმარი", რესურსის ნებართვის გარეშე, გამოიყენეთ შესაბამისი ფორმა საიტის მთავარ გვერდზე.
აირჩიეთ სასურველი დოკუმენტი ფაილის ღილაკის გამოყენებით, მიუთითეთ ტექსტის, გამომავალი ფორმატის ძირითადი ენა, შემდეგ დაველოდოთ ფაილის გადმოსაწერად და დააკონვერტიროთ.
- ციფრული პროცესის დასასრულს დააჭირეთ "ჩამოტვირთვის ფაილი" კომპიუტერზე მზა დოკუმენტის გადასარჩენად.
ავტორიზებული მომხმარებლებისთვის, ქმედებების თანმიმდევრობა გარკვეულწილად განსხვავებულია.
- გამოიყენეთ "რეგისტრაცია" ან "შესვლა" ღილაკი ზედა მენიუს პანელში, შესაბამისად, შექმნათ უფასო ონლაინ OCR ანგარიში ან მიდიან.
- აღიარების პანელში ავტორიზაციის შემდეგ, "CTRL" გასაღების ავტორიზაციის შემდეგ, შეარჩიეთ შემოთავაზებული სიიდან წყაროს დოკუმენტის ორ ენაზე.
- მიუთითეთ დამატებითი ტექსტური მოპოვების პარამეტრები PDF- დან და დააჭირეთ ღილაკს SELECT ფაილის ღილაკს სერვისის დოკუმენტის გადმოსაწერად.
შემდეგ, გააგრძელოს აღიარება, დააჭირეთ "კონვერტაციის".
- დოკუმენტის დამუშავების დასასრულს, დააჭირეთ ბმულს, რომელსაც მოუწოდა გამომავალი ფაილი შესაბამის სვეტში.
აღიარების შედეგი დაუყოვნებლივ შეინახება თქვენს კომპიუტერში მეხსიერებაში.
საჭიროების შემთხვევაში, მცირე PDF დოკუმენტის ტექსტის ამოღება შეიძლება უსაფრთხოდ იყოს ზემოთ აღწერილი ინსტრუმენტის გამოყენების შესახებ. მუშაობის მოცულობითი ფაილები, თქვენ უნდა შეიძინოთ დამატებითი სიმბოლოები უფასო ონლაინ OCR ან სხვა გამოსავალი.
მეთოდი 3: ახალი
სრულად უფასო OCR მომსახურება, რომელიც საშუალებას გაძლევთ ამონაწერი ტექსტის თითქმის ნებისმიერი გრაფიკული და ელექტრონული დოკუმენტები, როგორიცაა Djvu და PDF. რესურსი არ იძლევა შეზღუდული ფაილების ზომას და რაოდენობას, არ საჭიროებს რეგისტრაციას და სთავაზობს მასთან დაკავშირებულ ფუნქციებს.
Newocrorts მხარს უჭერს 106 ენაზე და შეუძლია სწორად დამუშავება კი დაბალი ხარისხის დოკუმენტები. შესაძლებელია ხელით აირჩიოთ ტექსტური აღიარების ფართობი ფაილის გვერდზე.
ონლაინ სერვისი Newocr
- ასე რომ, თქვენ შეგიძლიათ დაიწყოთ მუშაობა რესურსით დაუყოვნებლივ, დამატებითი ქმედებების შესასრულებლად.
მარჯვენა მთავარ გვერდზე არის ფორმა, რომელიც იმპორტის დოკუმენტის იმპორტისთვის არის. ჩამოტვირთეთ ფაილი Newocr, გამოიყენეთ აირჩიეთ ფაილის ღილაკი აირჩიეთ თქვენი ფაილი სექციაში. შემდეგ "აღიარების ენა (s)" სფეროში, მიუთითეთ ერთი ან მეტი წყარო დოკუმენტის ენაზე, შემდეგ დააჭირეთ ღილაკს "ატვირთვა + OCR".
- მიუთითეთ სასურველი აღიარების პარამეტრები, აირჩიეთ სასურველი გვერდი ტექსტის მისაღებად და დააჭირეთ OCR ღილაკს.
- გადახვევა ქვემოთ გვერდზე ოდნავ დაბალია და იპოვოს "ჩამოტვირთვა" ღილაკს.
დაწკაპეთ იგი და ჩამოსაშლელი სიაში, აირჩიეთ დოკუმენტის სასურველი ფორმატი. ამის შემდეგ, დასრულებული ფაილი მოპოვებული ტექსტით იქნება გადმოწერილი თქვენს კომპიუტერში.
ინსტრუმენტი არის მოსახერხებელი და საკმაოდ კარგად აღიარებს ყველა სიმბოლოს. თუმცა, იმპორტირებული PDF დოკუმენტის თითოეული გვერდის დამუშავება დამოუკიდებლად უნდა დაიწყოს და გამოჩნდება ცალკე ფაილში. თქვენ შეგიძლიათ, რა თქმა უნდა, დაუყოვნებლივ დააკოპირეთ აღიარების შედეგების ბუფერში და დააკავშიროთ მათ სხვები.
მიუხედავად ამისა, ზემოთ აღწერილი ნიუანსით, ტექსტის დიდი მოცულობის დიდი მოცულობის დიდი მოცულობით ძალიან რთულია. პატარა ფაილებით, სერვისი ასრულებს "ბანკს".
მეთოდი 4: ocr.space
ტექსტური ციფრულიზაციის მარტივი და გასაგები რესურსი საშუალებას გაძლევთ აღიაროთ PDF დოკუმენტები და გამოაქვეყნოს შედეგი TXT ფაილში. გვერდების რაოდენობის ლიმიტები არ არის გათვალისწინებული. ერთადერთი შეზღუდვა არის შეყვანის დოკუმენტის ზომა არ უნდა აღემატებოდეს 5 მეგაბაიტს.
ონლაინ სერვისი ocr.space
- თქვენ არ გჭირდებათ რეგისტრაცია ინსტრუმენტთან მუშაობა.
უბრალოდ დააჭირეთ ბმულს ზემოთ და ჩამოტვირთეთ PDF დოკუმენტი ადგილზე კომპიუტერის გამოყენებით "აირჩიეთ ფაილი" ღილაკს ან ქსელის მითითებით.
- აირჩიეთ OCR ენის ჩამოსაშლელი სია, აირჩიეთ იმპორტირებული დოკუმენტის ენა.
შემდეგ დააჭირეთ ტექსტური აღიარების პროცესს "დაწყება OCR!" ღილაკზე დაჭერით.
- ფაილის დამუშავების დასასრულს, იხილეთ შედეგი Ocr'ed შედეგი სფეროში და დააჭირეთ "ჩამოტვირთვა" დასრულებული TXT დოკუმენტის ჩამოტვირთვას.
თუ თქვენ უბრალოდ უნდა ამოიღოთ ტექსტი PDF- დან და ამავე დროს, საბოლოო ფორმატირება არ არის მნიშვნელოვანი, OCR.Space არის კარგი არჩევანი. ერთადერთი, დოკუმენტი უნდა იყოს "ერთჯერადი საუბარი", რადგან ორი ან მეტი ენების აღიარება ერთდროულად არ არის გათვალისწინებული.
დაწვრილებით: Finerader Complimentary Analogues
სტატიაში წარმოდგენილი ონლაინ ინსტრუმენტების შეფასებისას უნდა აღინიშნოს, რომ Abbyy- ს Finerader- ს ყველაზე ზუსტი და ხარისხობრივად OCR ფუნქციით. თუ თქვენ მნიშვნელოვანია ტექსტური აღიარების მაქსიმალური დეფორმაცია, ის საუკეთესოა, რომ კონკრეტულად განიხილოს ეს ვარიანტი. მაგრამ ისინი სავარაუდოდ გადაიხდიან მისთვის.
თუ მცირე დოკუმენტების ციფრული გჭირდებათ და თქვენ მზად ხართ სწორად გამოსწორდეს მომსახურების შეცდომები, სასურველია გამოიყენოთ Newocr, OCR.Space ან უფასო ონლაინ OCR.