आपण नेहमी PDF फाइलवरून सामान्य कॉपी पद्धत वापरून मजकूर काढून टाकू शकत नाही. बर्याचदा, अशा दस्तऐवजांची पृष्ठे त्यांच्या पेपर पर्यायांची स्कॅन केलेली सामग्री आहेत. अशा फायली पूर्णपणे संपादनयोग्य मजकूर डेटावर रूपांतरित करण्यासाठी, ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) फंक्शनसह विशेष प्रोग्राम वापरल्या जातात.
अशा निर्णयांमध्ये विक्रीत फारच जटिल आहेत आणि म्हणूनच पैसे आहेत. पीडीएफसह मजकूर ओळखण्याची आवश्यकता असल्यास आपण नियमितपणे उद्भवणार असल्यास योग्य प्रोग्राम खरेदी करणे योग्य ठरवेल. दुर्मिळ प्रकरणांसाठी, समान वैशिष्ट्यांसह उपलब्ध ऑनलाइन सेवांपैकी एक अधिक तार्किक असेल.
ऑनलाइन पीडीएफ सह मजकूर कसे ओळखायचे
पूर्णतः डेस्कटॉप सोल्युशन्सच्या तुलनेत, ओसीआर ऑनलाइन सेवांच्या वैशिष्ट्यांचा संच अधिक मर्यादित आहे. परंतु अशा संसाधने किंवा पूर्णपणे मुक्त किंवा प्रतीकात्मक फीसाठी कार्य करणे शक्य आहे. मुख्य गोष्ट अशी आहे की, त्याच्या मुख्य कार्यासह, मजकुराच्या मान्यतासह, संबंधित वेब अनुप्रयोग तसेच सामना करतील.पद्धत 1: अॅबाई फिनिअर ऑनलाइन
ही सेवा विकसक कंपनी कागदपत्रांच्या ऑप्टिकल मान्यता क्षेत्रातील नेत्यांपैकी एक आहे. विंडोज आणि मॅकसाठी अॅबॉई फिनिडेर पीडीएफ मजकूर दर्शविण्यासाठी आणि पुढे कार्य करण्यासाठी एक शक्तिशाली उपाय आहे.
कार्यक्रमाचे वेब अॅनालॉग नक्कीच कार्यक्षमतेद्वारे कनिष्ठ आहे. तरीसुद्धा, ही सेवा 1 9 0 पेक्षा जास्त भाषांमध्ये स्कॅन आणि फोटोग्राफमधून मजकूर ओळखू शकते. समर्थित पीडीएफ फाइल रूपांतरण वर्ड, एक्सेल दस्तऐवज इ.
ऑनलाइन सेवा अॅबाई फिनिअर ऑनलाइन
- आपण एखाद्या साधनासह कार्य करण्यास प्रारंभ करण्यापूर्वी, साइटवर एक खाते तयार करा किंवा फेसबुक, Google किंवा Microsoft खात्यासह लॉग इन करा.
अधिकृतता विंडोवर जाण्यासाठी, शीर्ष मेन्यू पॅनलमध्ये "लॉग इन" बटण क्लिक करा.
- लॉग इन करून, "फाइल्स डाउनलोड फाइल्स" बटण वापरून, finereer मध्ये इच्छित पीडीएफ दस्तऐवज आयात.
नंतर "पृष्ठ क्रमांक निवडा" क्लिक करा आणि मजकूर ओळखण्यासाठी इच्छित अंतर निर्दिष्ट करा.
- पुढे, डॉक्युमेंटमध्ये उपस्थित असलेल्या भाषा निवडा, परिणाम फाइल स्वरूप आणि "ओळखणे" बटणावर क्लिक करा.
- प्रक्रिया केल्यानंतर, ज्या कालावधीचा कालावधी दस्तऐवजाच्या प्रमाणावर पूर्णपणे अवलंबून असतो, आपण त्याच्या नावावर क्लिक करून मजकूर डेटासह तयार-तयार केलेला फाइल डाउनलोड करू शकता.
एकतर उपलब्ध क्लाउड सेवांपैकी एकावर ते निर्यात करा.
ही सेवा कदाचित प्रतिमा आणि पीडीएफ फायलींवर सर्वात अचूक मजकूर ओळख अल्गोरिदम आहे. परंतु, दुर्दैवाने, त्याचे विनामूल्य वापर दरमहा पाच-प्रक्रिया पृष्ठांवर मर्यादित आहे. अधिक मोठ्या दस्तऐवजांसह कार्य करण्यासाठी आपल्याला वार्षिक सदस्यता खरेदी करावी लागेल.
तथापि, जर ओसीआर फंक्शनला अगदी क्वचितच आवश्यक असेल तर, लहान पीडीएफ फायलींमधून मजकूर काढण्यासाठी अॅबाई फिनियर ऑनलाइन एक उत्कृष्ट पर्याय आहे.
पद्धत 2: विनामूल्य ऑनलाइन ओसीआर
साधे आणि सोयीस्कर मजकूर digitizing मजकूर. नोंदणी करण्याची आवश्यकता न करता, स्त्रोत आपल्याला प्रति तास 15 पूर्ण पीडीएफ पृष्ठ ओळखण्याची परवानगी देते. 46 भाषांमध्ये विनामूल्य ऑनलाइन ओसीआर पूर्णपणे दस्तऐवजांसह कार्य करते आणि अधिकृततेशिवाय तीन मजकूर निर्यातीस समर्थन देते - डॉक्टर, एक्सएलएसएक्स आणि टीएक्स.
नोंदणी करताना, वापरकर्त्यास बहु-पृष्ठ दस्तऐवजांवर प्रक्रिया करण्याची संधी मिळते, तथापि, या पृष्ठांची विनामूल्य संख्या 50 युनिट्सपर्यंत मर्यादित आहे.
ऑनलाइन सेवा विनामूल्य ऑनलाइन ओसीआर
- पीडीएफकडून "अतिथी" म्हणून मजकूर ओळखण्यासाठी, स्त्रोतावरील अधिकृततेशिवाय, साइटच्या मुख्य पृष्ठावर योग्य फॉर्म वापरा.
फाइल बटण वापरून इच्छित दस्तऐवज निवडा, मजकूर, आउटपुट स्वरूपनाची मुख्य भाषा निर्दिष्ट करा, नंतर फाइल डाउनलोड करण्यासाठी आणि रूपांतरित करण्यासाठी प्रतीक्षा करा.
- डिजिटलीकरण प्रक्रियेच्या शेवटी, संगणकावरील मजकूरासह तयार दस्तऐवज जतन करण्यासाठी "आउटपुट फाइल डाउनलोड करा" क्लिक करा.
अधिकृत वापरकर्त्यांसाठी, क्रियांची क्रम काही प्रमाणात भिन्न आहे.
- शीर्ष मेन्यू पॅनलमध्ये क्रमशः "नोंदणी" किंवा "लॉग इन" बटण वापरा, एक विनामूल्य ऑनलाइन ओसीआर खाते तयार करा किंवा त्यावर जा.
- मान्यता पॅनेलमध्ये अधिकृतता नंतर, "Ctrl" की धारण केल्यानंतर, प्रस्तावित सूचीमधून स्त्रोत दस्तऐवजाच्या दोन भाषेपर्यंत निवडा.
- पीडीएफकडून पुढील मजकूर निष्कर्ष पॅरामीटर्स निर्दिष्ट करा आणि दस्तऐवजावर दस्तऐवज डाउनलोड करण्यासाठी निवडा फाइल बटण क्लिक करा.
मग, ओळख सह पुढे जाण्यासाठी, "रूपांतरित" क्लिक करा.
- दस्तऐवजाच्या प्रक्रियेच्या शेवटी, योग्य स्तंभात आउटपुट फाइल नावाच्या दुव्यावर क्लिक करा.
ओळख परिणाम त्वरित आपल्या संगणकाच्या मेमरीमध्ये जतन केले जाईल.
आवश्यक असल्यास, लहान पीडीएफ दस्तऐवजातून मजकूर काढून टाका वर वर्णन केलेल्या साधनाचा वापर करण्यास सुरक्षित असू शकते. मोठ्या फायलीसह कार्य करण्यासाठी आपल्याला विनामूल्य ऑनलाइन ओसीआरमध्ये अतिरिक्त वर्ण खरेदी करावे किंवा दुसर्या सोल्यूशनवर अतिरिक्त वर्ण खरेदी करावे लागतील.
पद्धत 3: न्यूटोओरो
पूर्णपणे विनामूल्य ओसीआर सेवा जी आपल्याला Djvu आणि PDF सारख्या जवळजवळ कोणत्याही ग्राफिक आणि इलेक्ट्रॉनिक दस्तऐवजांमधून मजकूर काढण्याची परवानगी देते. स्त्रोत आकार आणि ओळखण्यायोग्य फायलींच्या संख्येवर निर्बंध लागू करीत नाही, नोंदणीसाठी आवश्यक नाही आणि संबंधित कार्यांची विस्तृत श्रेणी ऑफर करते.
न्यूओक्टरो 106 भाषांचे समर्थन करते आणि कागदपत्रांच्या अगदी कमी दर्जाचे स्कॅन देखील योग्यरित्या प्रक्रिया करू शकते. फाइल पृष्ठावर मजकूर ओळख क्षेत्र मॅन्युअली निवडणे शक्य आहे.
ऑनलाइन सेवा ऑनलाइन सेवा
- म्हणून, आपण अतिरिक्त क्रिया करण्याची आवश्यकता नसताना, आपण त्वरित संसाधनासह कार्य करण्यास प्रारंभ करू शकता.
मुख्य पृष्ठावर थेट साइटवर दस्तऐवज आयात करण्यासाठी एक फॉर्म आहे. नवीनओरो येथे फाइल डाउनलोड करण्यासाठी, आपल्या फाइल विभागात निवडा सिलेक्ट बटण निवडा. नंतर "ओळख भाषा (ओं)" फील्डमध्ये, एक किंवा अधिक स्त्रोत दस्तऐवज भाषा निर्दिष्ट करा आणि नंतर "अपलोड + ओसीआर" वर क्लिक करा.
- आपल्या पसंतीची ओळख सेटिंग्ज निर्दिष्ट करा, मजकूर पुनर्प्राप्त करण्यासाठी वांछित पृष्ठ निवडा आणि ओसीआर बटणावर क्लिक करा.
- पृष्ठ खाली खाली स्क्रोल करा आणि "डाउनलोड करा" बटण शोधा.
त्यावर क्लिक करा आणि ड्रॉप-डाउन सूचीमध्ये, डॉक्युमेंटचे इच्छित स्वरूप डाउनलोड करण्यासाठी निवडा. त्यानंतर, काढलेल्या मजकुरासह तयार केलेली फाइल आपल्या संगणकावर डाउनलोड केली जाईल.
साधन सोयीस्कर आहे आणि सर्व वर्ण ओळखले जातात. तथापि, आयात केलेल्या पीडीएफ दस्तऐवजाच्या प्रत्येक पृष्ठाची प्रक्रिया स्वतंत्रपणे लॉन्च करणे आवश्यक आहे आणि वेगळ्या फाइलमध्ये प्रदर्शित केले जाते. आपण नक्कीच ओळखू शकता, ओळख ब्रिपबोर्डमध्ये कॉपी करा आणि त्यांना इतरांसह एकत्र करा.
तरीसुद्धा, उपरोक्त वर्णित नुसते, नवीन भाषेच्या मोठ्या प्रमाणावर मजकूर दिल्या गेलेल्या मोठ्या खंडांना खूप कठीण होते. लहान फायलींसह, सेवा कॉपी "बॅगसह".
पद्धत 4: ओसीआर.एसपी
मजकूर डिजिटायझेशनसाठी एक साधे आणि समजण्यायोग्य संसाधन आपल्याला पीडीएफ दस्तऐवज ओळखण्याची आणि परिणामास txt फाइलमध्ये आउटपुट करण्यास अनुमती देते. पृष्ठांची संख्या मर्यादित नाही. केवळ मर्यादा म्हणजे इनपुट दस्तऐवजाचे आकार 5 मेगाबाइट्सपेक्षा जास्त नसावे.
ऑनलाइन सेवा ocr.space.
- आपल्याला साधनासह काम करण्यासाठी नोंदणी करण्याची आवश्यकता नाही.
उपरोक्त दुव्यावर क्लिक करा आणि "फाइल निवडा" बटण वापरून किंवा नेटवर्कवरून नेटवर्कवरून संगणकावरून PDF दस्तऐवज डाउनलोड करा.
- निवडा ओसीआर भाषा ड्रॉप-डाउन यादी, आयात केलेल्या दस्तऐवजाची भाषा निवडा.
नंतर "प्रारंभ ocr!" बटण क्लिक करून मजकूर ओळख प्रक्रिया चालवा.
- फाइल प्रक्रियेच्या शेवटी, Ocr'ed परिणाम फील्डमध्ये परिणाम पहा आणि तयार TXT दस्तऐवज डाउनलोड करण्यासाठी "डाउनलोड करा" क्लिक करा.
आपल्याला फक्त पीडीएफकडून मजकूर काढण्याची आवश्यकता असल्यास आणि त्याच वेळी अंतिम स्वरूप करणे हे सर्व महत्वाचे नाही, OCR.space एक चांगली निवड आहे. सेवा मध्ये एकाच वेळी दोन किंवा अधिक भाषा मान्य केल्यापासून कागदपत्र "एकल बोलणारे" असणे आवश्यक आहे.
तसेच वाचा: finereader प्रशस्त allogues
लेखात सादर केलेल्या ऑनलाइन उपकरणांचे मूल्यांकन करणे हे लक्षात ठेवावे की एबीबीकडून अॅबैबिअरचा सर्वात अचूक आणि गुणोत्तर आहे. आपण आपल्यासाठी मजकूर ओळखण्याची जास्तीत जास्त विकृती असल्यास, या पर्यायाचा विचार करणे चांगले आहे. पण ते कदाचित त्यांच्यासाठी पैसे देतात.
आपल्याला लहान दस्तऐवजांच्या डिजिटलीकरणाची आवश्यकता असल्यास आणि सेवा त्रुटी योग्यरित्या योग्यरित्या तयार करण्यासाठी तयार असल्यास, न्यूओको, ओसीआर.एसपी किंवा विनामूल्य ऑनलाइन ओसीआर वापरण्याची शिफारस केली जाते.