ऑनलाइन पीडीएफ फाइल कशी ओळखायची

Anonim

ऑनलाइन पीडीएफ फाइल कशी ओळखायची

आपण नेहमी PDF फाइलवरून सामान्य कॉपी पद्धत वापरून मजकूर काढून टाकू शकत नाही. बर्याचदा, अशा दस्तऐवजांची पृष्ठे त्यांच्या पेपर पर्यायांची स्कॅन केलेली सामग्री आहेत. अशा फायली पूर्णपणे संपादनयोग्य मजकूर डेटावर रूपांतरित करण्यासाठी, ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) फंक्शनसह विशेष प्रोग्राम वापरल्या जातात.

अशा निर्णयांमध्ये विक्रीत फारच जटिल आहेत आणि म्हणूनच पैसे आहेत. पीडीएफसह मजकूर ओळखण्याची आवश्यकता असल्यास आपण नियमितपणे उद्भवणार असल्यास योग्य प्रोग्राम खरेदी करणे योग्य ठरवेल. दुर्मिळ प्रकरणांसाठी, समान वैशिष्ट्यांसह उपलब्ध ऑनलाइन सेवांपैकी एक अधिक तार्किक असेल.

ऑनलाइन पीडीएफ सह मजकूर कसे ओळखायचे

पूर्णतः डेस्कटॉप सोल्युशन्सच्या तुलनेत, ओसीआर ऑनलाइन सेवांच्या वैशिष्ट्यांचा संच अधिक मर्यादित आहे. परंतु अशा संसाधने किंवा पूर्णपणे मुक्त किंवा प्रतीकात्मक फीसाठी कार्य करणे शक्य आहे. मुख्य गोष्ट अशी आहे की, त्याच्या मुख्य कार्यासह, मजकुराच्या मान्यतासह, संबंधित वेब अनुप्रयोग तसेच सामना करतील.

पद्धत 1: अॅबाई फिनिअर ऑनलाइन

ही सेवा विकसक कंपनी कागदपत्रांच्या ऑप्टिकल मान्यता क्षेत्रातील नेत्यांपैकी एक आहे. विंडोज आणि मॅकसाठी अॅबॉई फिनिडेर पीडीएफ मजकूर दर्शविण्यासाठी आणि पुढे कार्य करण्यासाठी एक शक्तिशाली उपाय आहे.

कार्यक्रमाचे वेब अॅनालॉग नक्कीच कार्यक्षमतेद्वारे कनिष्ठ आहे. तरीसुद्धा, ही सेवा 1 9 0 पेक्षा जास्त भाषांमध्ये स्कॅन आणि फोटोग्राफमधून मजकूर ओळखू शकते. समर्थित पीडीएफ फाइल रूपांतरण वर्ड, एक्सेल दस्तऐवज इ.

ऑनलाइन सेवा अॅबाई फिनिअर ऑनलाइन

  1. आपण एखाद्या साधनासह कार्य करण्यास प्रारंभ करण्यापूर्वी, साइटवर एक खाते तयार करा किंवा फेसबुक, Google किंवा Microsoft खात्यासह लॉग इन करा.

    ऑनलाइन सेवा ABYY fineerder ऑनलाइन नोंदणी

    अधिकृतता विंडोवर जाण्यासाठी, शीर्ष मेन्यू पॅनलमध्ये "लॉग इन" बटण क्लिक करा.

  2. लॉग इन करून, "फाइल्स डाउनलोड फाइल्स" बटण वापरून, finereer मध्ये इच्छित पीडीएफ दस्तऐवज आयात.

    ऑनलाइन सेवा Abyy fineerder ऑनलाइन पीडीएफ दस्तऐवज पासून मजकूर ओळख

    नंतर "पृष्ठ क्रमांक निवडा" क्लिक करा आणि मजकूर ओळखण्यासाठी इच्छित अंतर निर्दिष्ट करा.

  3. पुढे, डॉक्युमेंटमध्ये उपस्थित असलेल्या भाषा निवडा, परिणाम फाइल स्वरूप आणि "ओळखणे" बटणावर क्लिक करा.

    पीडीएफ दस्तऐवजातून पीडीएफ दस्तावेज ऑनलाइन मध्ये मजकूर ओळख सुरू करा

  4. प्रक्रिया केल्यानंतर, ज्या कालावधीचा कालावधी दस्तऐवजाच्या प्रमाणावर पूर्णपणे अवलंबून असतो, आपण त्याच्या नावावर क्लिक करून मजकूर डेटासह तयार-तयार केलेला फाइल डाउनलोड करू शकता.

    ऑनलाइन सेवा अॅबाई फिनिअरर ऑनलाइन पासून एक पूर्ण दस्तऐवज डाउनलोड करणे

    एकतर उपलब्ध क्लाउड सेवांपैकी एकावर ते निर्यात करा.

ही सेवा कदाचित प्रतिमा आणि पीडीएफ फायलींवर सर्वात अचूक मजकूर ओळख अल्गोरिदम आहे. परंतु, दुर्दैवाने, त्याचे विनामूल्य वापर दरमहा पाच-प्रक्रिया पृष्ठांवर मर्यादित आहे. अधिक मोठ्या दस्तऐवजांसह कार्य करण्यासाठी आपल्याला वार्षिक सदस्यता खरेदी करावी लागेल.

तथापि, जर ओसीआर फंक्शनला अगदी क्वचितच आवश्यक असेल तर, लहान पीडीएफ फायलींमधून मजकूर काढण्यासाठी अॅबाई फिनियर ऑनलाइन एक उत्कृष्ट पर्याय आहे.

पद्धत 2: विनामूल्य ऑनलाइन ओसीआर

साधे आणि सोयीस्कर मजकूर digitizing मजकूर. नोंदणी करण्याची आवश्यकता न करता, स्त्रोत आपल्याला प्रति तास 15 पूर्ण पीडीएफ पृष्ठ ओळखण्याची परवानगी देते. 46 भाषांमध्ये विनामूल्य ऑनलाइन ओसीआर पूर्णपणे दस्तऐवजांसह कार्य करते आणि अधिकृततेशिवाय तीन मजकूर निर्यातीस समर्थन देते - डॉक्टर, एक्सएलएसएक्स आणि टीएक्स.

नोंदणी करताना, वापरकर्त्यास बहु-पृष्ठ दस्तऐवजांवर प्रक्रिया करण्याची संधी मिळते, तथापि, या पृष्ठांची विनामूल्य संख्या 50 युनिट्सपर्यंत मर्यादित आहे.

ऑनलाइन सेवा विनामूल्य ऑनलाइन ओसीआर

  1. पीडीएफकडून "अतिथी" म्हणून मजकूर ओळखण्यासाठी, स्त्रोतावरील अधिकृततेशिवाय, साइटच्या मुख्य पृष्ठावर योग्य फॉर्म वापरा.

    ऑनलाइन विनामूल्य ऑनलाइन ओसीआर मध्ये पीडीएफ ओळख

    फाइल बटण वापरून इच्छित दस्तऐवज निवडा, मजकूर, आउटपुट स्वरूपनाची मुख्य भाषा निर्दिष्ट करा, नंतर फाइल डाउनलोड करण्यासाठी आणि रूपांतरित करण्यासाठी प्रतीक्षा करा.

  2. डिजिटलीकरण प्रक्रियेच्या शेवटी, संगणकावरील मजकूरासह तयार दस्तऐवज जतन करण्यासाठी "आउटपुट फाइल डाउनलोड करा" क्लिक करा.

    विनामूल्य ऑनलाइन ओसीआर ऑनलाइन सेवा पासून पीडीएफ सह मजकूर ओळख लोड करीत आहे

अधिकृत वापरकर्त्यांसाठी, क्रियांची क्रम काही प्रमाणात भिन्न आहे.

  1. शीर्ष मेन्यू पॅनलमध्ये क्रमशः "नोंदणी" किंवा "लॉग इन" बटण वापरा, एक विनामूल्य ऑनलाइन ओसीआर खाते तयार करा किंवा त्यावर जा.

    ऑनलाइन विनामूल्य ऑनलाइन ओसीआर मध्ये खाते तयार करणे

  2. मान्यता पॅनेलमध्ये अधिकृतता नंतर, "Ctrl" की धारण केल्यानंतर, प्रस्तावित सूचीमधून स्त्रोत दस्तऐवजाच्या दोन भाषेपर्यंत निवडा.

    मजकूर ओळखीसाठी विनामूल्य ऑनलाइन ओसीआर मध्ये मजकूर ओळखण्यासाठी स्त्रोत दस्तऐवजाची भाषा परिभाषा

  3. पीडीएफकडून पुढील मजकूर निष्कर्ष पॅरामीटर्स निर्दिष्ट करा आणि दस्तऐवजावर दस्तऐवज डाउनलोड करण्यासाठी निवडा फाइल बटण क्लिक करा.

    ऑनलाइन सेवा विनामूल्य ऑनलाइन ओसीआर मध्ये पीडीएफ दस्तऐवज ओळख सुरू करा

    मग, ओळख सह पुढे जाण्यासाठी, "रूपांतरित" क्लिक करा.

  4. दस्तऐवजाच्या प्रक्रियेच्या शेवटी, योग्य स्तंभात आउटपुट फाइल नावाच्या दुव्यावर क्लिक करा.

    विनामूल्य ऑनलाइन ओसीआर ऑनलाइन सेवा पासून समाप्त डॉकक्स फाइल डाउनलोड करणे

    ओळख परिणाम त्वरित आपल्या संगणकाच्या मेमरीमध्ये जतन केले जाईल.

आवश्यक असल्यास, लहान पीडीएफ दस्तऐवजातून मजकूर काढून टाका वर वर्णन केलेल्या साधनाचा वापर करण्यास सुरक्षित असू शकते. मोठ्या फायलीसह कार्य करण्यासाठी आपल्याला विनामूल्य ऑनलाइन ओसीआरमध्ये अतिरिक्त वर्ण खरेदी करावे किंवा दुसर्या सोल्यूशनवर अतिरिक्त वर्ण खरेदी करावे लागतील.

पद्धत 3: न्यूटोओरो

पूर्णपणे विनामूल्य ओसीआर सेवा जी आपल्याला Djvu आणि PDF सारख्या जवळजवळ कोणत्याही ग्राफिक आणि इलेक्ट्रॉनिक दस्तऐवजांमधून मजकूर काढण्याची परवानगी देते. स्त्रोत आकार आणि ओळखण्यायोग्य फायलींच्या संख्येवर निर्बंध लागू करीत नाही, नोंदणीसाठी आवश्यक नाही आणि संबंधित कार्यांची विस्तृत श्रेणी ऑफर करते.

न्यूओक्टरो 106 भाषांचे समर्थन करते आणि कागदपत्रांच्या अगदी कमी दर्जाचे स्कॅन देखील योग्यरित्या प्रक्रिया करू शकते. फाइल पृष्ठावर मजकूर ओळख क्षेत्र मॅन्युअली निवडणे शक्य आहे.

ऑनलाइन सेवा ऑनलाइन सेवा

  1. म्हणून, आपण अतिरिक्त क्रिया करण्याची आवश्यकता नसताना, आपण त्वरित संसाधनासह कार्य करण्यास प्रारंभ करू शकता.

    नवीन ऑनलाइन सेवा ओळखण्यासाठी पीडीएफ फाइल लोड करणे

    मुख्य पृष्ठावर थेट साइटवर दस्तऐवज आयात करण्यासाठी एक फॉर्म आहे. नवीनओरो येथे फाइल डाउनलोड करण्यासाठी, आपल्या फाइल विभागात निवडा सिलेक्ट बटण निवडा. नंतर "ओळख भाषा (ओं)" फील्डमध्ये, एक किंवा अधिक स्त्रोत दस्तऐवज भाषा निर्दिष्ट करा आणि नंतर "अपलोड + ओसीआर" वर क्लिक करा.

  2. आपल्या पसंतीची ओळख सेटिंग्ज निर्दिष्ट करा, मजकूर पुनर्प्राप्त करण्यासाठी वांछित पृष्ठ निवडा आणि ओसीआर बटणावर क्लिक करा.

    नवीन सेव्ह मध्ये पीडीएफ सह मजकूर ओळख सेट आणि लॉन्च करणे

  3. पृष्ठ खाली खाली स्क्रोल करा आणि "डाउनलोड करा" बटण शोधा.

    संगणकावर नवीनओओओओटी मध्ये शिकलेले डाउनलोड

    त्यावर क्लिक करा आणि ड्रॉप-डाउन सूचीमध्ये, डॉक्युमेंटचे इच्छित स्वरूप डाउनलोड करण्यासाठी निवडा. त्यानंतर, काढलेल्या मजकुरासह तयार केलेली फाइल आपल्या संगणकावर डाउनलोड केली जाईल.

साधन सोयीस्कर आहे आणि सर्व वर्ण ओळखले जातात. तथापि, आयात केलेल्या पीडीएफ दस्तऐवजाच्या प्रत्येक पृष्ठाची प्रक्रिया स्वतंत्रपणे लॉन्च करणे आवश्यक आहे आणि वेगळ्या फाइलमध्ये प्रदर्शित केले जाते. आपण नक्कीच ओळखू शकता, ओळख ब्रिपबोर्डमध्ये कॉपी करा आणि त्यांना इतरांसह एकत्र करा.

तरीसुद्धा, उपरोक्त वर्णित नुसते, नवीन भाषेच्या मोठ्या प्रमाणावर मजकूर दिल्या गेलेल्या मोठ्या खंडांना खूप कठीण होते. लहान फायलींसह, सेवा कॉपी "बॅगसह".

पद्धत 4: ओसीआर.एसपी

मजकूर डिजिटायझेशनसाठी एक साधे आणि समजण्यायोग्य संसाधन आपल्याला पीडीएफ दस्तऐवज ओळखण्याची आणि परिणामास txt फाइलमध्ये आउटपुट करण्यास अनुमती देते. पृष्ठांची संख्या मर्यादित नाही. केवळ मर्यादा म्हणजे इनपुट दस्तऐवजाचे आकार 5 मेगाबाइट्सपेक्षा जास्त नसावे.

ऑनलाइन सेवा ocr.space.

  1. आपल्याला साधनासह काम करण्यासाठी नोंदणी करण्याची आवश्यकता नाही.

    ऑनलाइन ओकेआर.एसपी सेवेमध्ये पीडीएफ फाइल आयात करा

    उपरोक्त दुव्यावर क्लिक करा आणि "फाइल निवडा" बटण वापरून किंवा नेटवर्कवरून नेटवर्कवरून संगणकावरून PDF दस्तऐवज डाउनलोड करा.

  2. निवडा ओसीआर भाषा ड्रॉप-डाउन यादी, आयात केलेल्या दस्तऐवजाची भाषा निवडा.

    ऑनलाइन सेवा ocr.space मध्ये पीडीएफ दस्तऐवज ओळख प्रक्रिया चालवत आहे

    नंतर "प्रारंभ ocr!" बटण क्लिक करून मजकूर ओळख प्रक्रिया चालवा.

  3. फाइल प्रक्रियेच्या शेवटी, Ocr'ed परिणाम फील्डमध्ये परिणाम पहा आणि तयार TXT दस्तऐवज डाउनलोड करण्यासाठी "डाउनलोड करा" क्लिक करा.

    ओसीआर.एसपी ऑनलाइन सेवा पासून पीडीएफ फाइल ओळख परिणाम डाउनलोड करणे

आपल्याला फक्त पीडीएफकडून मजकूर काढण्याची आवश्यकता असल्यास आणि त्याच वेळी अंतिम स्वरूप करणे हे सर्व महत्वाचे नाही, OCR.space एक चांगली निवड आहे. सेवा मध्ये एकाच वेळी दोन किंवा अधिक भाषा मान्य केल्यापासून कागदपत्र "एकल बोलणारे" असणे आवश्यक आहे.

तसेच वाचा: finereader प्रशस्त allogues

लेखात सादर केलेल्या ऑनलाइन उपकरणांचे मूल्यांकन करणे हे लक्षात ठेवावे की एबीबीकडून अॅबैबिअरचा सर्वात अचूक आणि गुणोत्तर आहे. आपण आपल्यासाठी मजकूर ओळखण्याची जास्तीत जास्त विकृती असल्यास, या पर्यायाचा विचार करणे चांगले आहे. पण ते कदाचित त्यांच्यासाठी पैसे देतात.

आपल्याला लहान दस्तऐवजांच्या डिजिटलीकरणाची आवश्यकता असल्यास आणि सेवा त्रुटी योग्यरित्या योग्यरित्या तयार करण्यासाठी तयार असल्यास, न्यूओको, ओसीआर.एसपी किंवा विनामूल्य ऑनलाइन ओसीआर वापरण्याची शिफारस केली जाते.

पुढे वाचा