คุณไม่สามารถลบข้อความออกจากไฟล์ PDF ได้เสมอโดยใช้วิธีการคัดลอกตามปกติ บ่อยครั้งที่หน้าของเอกสารดังกล่าวเป็นเนื้อหาที่สแกนของตัวเลือกกระดาษของพวกเขา ในการแปลงไฟล์ดังกล่าวเป็นข้อมูลข้อความที่แก้ไขได้อย่างสมบูรณ์โปรแกรมพิเศษจะใช้กับฟังก์ชั่นการจดจำตัวละครออปติคอล (OCR)
การตัดสินใจดังกล่าวมีความซับซ้อนมากในการขายและดังนั้นจึงมีเงินจำนวนมาก หากต้องการการจดจำข้อความด้วย PDF ที่คุณเกิดขึ้นเป็นประจำจะแนะนำให้ซื้อโปรแกรมที่เหมาะสม สำหรับกรณีที่หายากหนึ่งในบริการออนไลน์ที่มีอยู่ที่มีคุณสมบัติคล้ายกันจะเป็นตรรกะมากขึ้น
วิธีการรับรู้ข้อความด้วย PDF ออนไลน์
แน่นอนชุดของคุณสมบัติของ OCR Online Services เมื่อเทียบกับโซลูชันเดสก์ท็อปที่เต็มเปี่ยมมีจำนวน จำกัด มากขึ้น แต่มันเป็นไปได้ที่จะทำงานกับทรัพยากรดังกล่าวหรือฟรีอย่างสมบูรณ์หรือสำหรับค่าธรรมเนียมสัญลักษณ์ สิ่งสำคัญคือด้วยงานหลักคือด้วยการรับรู้ข้อความแอปพลิเคชันเว็บที่สอดคล้องกันจะรับมือเช่นกันวิธีที่ 1: Abbyy Finereader ออนไลน์
บริษัท ผู้พัฒนาบริการเป็นหนึ่งในผู้นำในสาขาการรับรู้ของออปติคัลของเอกสาร Abbyy FineReader สำหรับ Windows และ Mac เป็นโซลูชั่นที่ทรงพลังสำหรับการแปลง PDF เป็นข้อความและทำงานต่อไปได้
เว็บอะนาล็อกของโปรแกรมแน่นอนด้อยกว่าฟังก์ชั่น อย่างไรก็ตามการบริการสามารถรับรู้ข้อความจากสแกนและภาพถ่ายได้มากกว่า 190 ภาษา รองรับการแปลงไฟล์ PDF เป็นเอกสาร excel ฯลฯ
บริการออนไลน์ Abbyy Finereader ออนไลน์
- ก่อนที่คุณจะเริ่มทำงานกับเครื่องมือให้สร้างบัญชีบนเว็บไซต์หรือเข้าสู่ระบบด้วยบัญชี Facebook, Google หรือ Microsoft
หากต้องการไปที่หน้าต่างการอนุญาตให้คลิกปุ่ม "เข้าสู่ระบบ" ในแผงเมนูด้านบน
- โดยการลงชื่อเข้าใช้นำเข้าเอกสาร PDF ที่ต้องการใน Finereader โดยใช้ปุ่ม "ดาวน์โหลดไฟล์"
จากนั้นคลิก "เลือกหมายเลขหน้า" และระบุช่องว่างที่ต้องการเพื่อจดจำข้อความ
- ถัดไปเลือกภาษาที่มีอยู่ในเอกสารรูปแบบไฟล์ผลลัพธ์และคลิกที่ปุ่ม "รับรู้"
- หลังจากการประมวลผลระยะเวลาที่ขึ้นอยู่กับจำนวนเอกสารทั้งหมดคุณสามารถดาวน์โหลดไฟล์สำเร็จรูปด้วยข้อมูลข้อความโดยเพียงแค่คลิกที่ชื่อ
ส่งออกไปยังหนึ่งในบริการคลาวด์ที่มีอยู่
บริการอาจเป็นอัลกอริทึมการจดจำข้อความที่แม่นยำที่สุดในรูปภาพและไฟล์ PDF แต่น่าเสียดายที่การใช้งานฟรีของมัน จำกัด อยู่ที่ห้าหน้าประมวลผลต่อเดือน ในการทำงานกับเอกสารที่มีขนาดใหญ่มากขึ้นคุณจะต้องซื้อการสมัครสมาชิกรายปี
อย่างไรก็ตามหากต้องการฟังก์ชั่น OCR ค่อนข้างน้อย Abbyy Finereader Online เป็นตัวเลือกที่ยอดเยี่ยมในการแยกข้อความจากไฟล์ PDF ขนาดเล็ก
วิธีที่ 2: OCR ออนไลน์ฟรี
ข้อความดิจิทัลที่ง่ายและสะดวก โดยไม่จำเป็นต้องลงทะเบียนทรัพยากรช่วยให้คุณจดจำหน้า PDF เต็มรูปแบบ 15 หน้าต่อชั่วโมง OCR ออนไลน์ฟรีทำงานได้อย่างเต็มที่กับเอกสารใน 46 ภาษาและไม่มีการอนุญาตรองรับการส่งออกข้อความสามครั้ง - DOCX, XLSX และ TXT
เมื่อลงทะเบียนผู้ใช้จะได้รับโอกาสในการประมวลผลเอกสารหลายหน้าอย่างไรก็ตามหมายเลขฟรีของหน้าเหล่านี้ จำกัด อยู่ที่ 50 หน่วย
บริการออนไลน์ออนไลน์ฟรี OCR
- ในการจดจำข้อความจาก PDF เป็น "แขก" โดยไม่ได้รับอนุญาตเกี่ยวกับทรัพยากรให้ใช้แบบฟอร์มที่เหมาะสมในหน้าหลักของเว็บไซต์
เลือกเอกสารที่ต้องการโดยใช้ปุ่มไฟล์ให้ระบุภาษาหลักของข้อความรูปแบบเอาต์พุตจากนั้นรอให้ไฟล์ดาวน์โหลดและคลิกแปลง
- ในตอนท้ายของกระบวนการแปลงดิจิทัลคลิก "ดาวน์โหลดไฟล์เอาต์พุต" เพื่อบันทึกเอกสารสำเร็จรูปด้วยข้อความบนคอมพิวเตอร์
สำหรับผู้ใช้ที่ได้รับอนุญาตลำดับของการกระทำนั้นค่อนข้างแตกต่างกัน
- ใช้ปุ่ม "ลงทะเบียน" หรือ "เข้าสู่ระบบ" ในแผงเมนูด้านบนตามลำดับสร้างบัญชี OCR ออนไลน์ฟรีหรือไปที่มัน
- หลังจากการอนุญาตในแผงจดจำการจดจำกดปุ่ม "Ctrl" ให้เลือกสองภาษาของเอกสารต้นฉบับจากรายการที่เสนอ
- ระบุพารามิเตอร์การสกัดข้อความเพิ่มเติมจาก PDF และคลิกปุ่มเลือกไฟล์เพื่อดาวน์โหลดเอกสารไปยังเซอร์วิส
จากนั้นเพื่อดำเนินการรับรู้แล้วคลิก "แปลง"
- ในตอนท้ายของการประมวลผลของเอกสารให้คลิกที่ลิงค์ที่เรียกว่าไฟล์เอาต์พุตในคอลัมน์ที่เหมาะสม
ผลลัพธ์ของการรับรู้จะถูกบันทึกในหน่วยความจำของคอมพิวเตอร์ของคุณทันที
หากจำเป็นให้ลบข้อความจากเอกสาร PDF ขนาดเล็กสามารถปลอดภัยที่จะใช้เครื่องมือที่อธิบายไว้ข้างต้น ในการทำงานกับไฟล์ขนาดใหญ่คุณจะต้องซื้อตัวละครเพิ่มเติมใน OCR ออนไลน์ฟรีหรือรีสอร์ทเพื่อแก้ปัญหาอื่น
วิธีที่ 3: Newocr
บริการ OCR ฟรีอย่างเต็มที่ที่ช่วยให้คุณสามารถแยกข้อความจากเอกสารกราฟิกและอิเล็กทรอนิกส์เกือบทุกชนิดเช่น DJVU และ PDF ทรัพยากรไม่ได้กำหนดข้อ จำกัด เกี่ยวกับขนาดและจำนวนไฟล์ที่เป็นที่รู้จักไม่จำเป็นต้องลงทะเบียนและเสนอฟังก์ชั่นที่เกี่ยวข้องมากมาย
NEWOCR รองรับ 106 ภาษาและสามารถประมวลผลเอกสารที่มีคุณภาพต่ำได้อย่างถูกต้อง เป็นไปได้ที่จะเลือกพื้นที่การจดจำข้อความด้วยตนเองในหน้าไฟล์
บริการออนไลน์ Newocr
- ดังนั้นคุณสามารถเริ่มทำงานกับทรัพยากรได้ทันทีโดยไม่จำเป็นต้องดำเนินการพิเศษ
ขวาบนหน้าหลักมีแบบฟอร์มสำหรับการนำเข้าเอกสารไปยังเว็บไซต์ ในการดาวน์โหลดไฟล์ใน Newocr ให้ใช้ปุ่มเลือกไฟล์ในส่วนเลือกไฟล์ของคุณ จากนั้นในฟิลด์ "ภาษาการจดจำ (S)" ระบุภาษาเอกสารต้นทางหนึ่งภาษาขึ้นไปแล้วคลิก "อัปโหลด + OCR"
- ระบุการตั้งค่าการจดจำที่คุณต้องการให้เลือกหน้าเว็บที่ต้องการเพื่อดึงข้อความและคลิกที่ปุ่ม OCR
- เลื่อนหน้าลงไปด้านล่างเล็กน้อยและค้นหาปุ่ม "ดาวน์โหลด"
คลิกที่ไอทีและในรายการดรอปดาวน์เลือกรูปแบบที่ต้องการของเอกสารเพื่อดาวน์โหลด หลังจากนั้นไฟล์ที่เสร็จแล้วที่มีข้อความสกัดจะถูกดาวน์โหลดไปยังคอมพิวเตอร์ของคุณ
เครื่องมือนี้สะดวกและค่อนข้างรู้จักตัวละครทั้งหมดได้ดี อย่างไรก็ตามการประมวลผลของแต่ละหน้าของเอกสาร PDF ที่นำเข้าจะต้องเปิดตัวอิสระและแสดงในไฟล์แยกต่างหาก แน่นอนว่าคุณสามารถคัดลอกการรับรู้ได้ทันทีเป็นคลิปบอร์ดและรวมเข้ากับคนอื่น ๆ
อย่างไรก็ตามเนื่องจากความแตกต่างที่อธิบายไว้ข้างต้นจำนวนมากของข้อความที่ใช้ Newocr เพื่อสกัดยากมาก ด้วยไฟล์ขนาดเล็ก, Copes บริการ "ด้วยปัง"
วิธีที่ 4: ocr.space
ทรัพยากรที่เรียบง่ายและเข้าใจได้สำหรับการแปลงข้อความแบบดิจิทัลช่วยให้คุณสามารถจดจำเอกสาร PDF และส่งออกผลลัพธ์ในไฟล์ TXT ไม่มีการ จำกัด จำนวนหน้าเว็บ ข้อ จำกัด เดียวคือขนาดของเอกสารอินพุตไม่ควรเกิน 5 เมกะไบต์
OCR.Space บริการออนไลน์
- คุณไม่จำเป็นต้องลงทะเบียนเพื่อทำงานกับเครื่องมือ
เพียงคลิกที่ลิงค์ด้านบนและดาวน์โหลดเอกสาร PDF ไปยังไซต์จากคอมพิวเตอร์โดยใช้ปุ่ม "เลือกไฟล์" หรือจากเครือข่ายโดยการอ้างอิง
- ในรายการแบบเลื่อนลงภาษาเลือก OCR เลือกภาษาของเอกสารที่นำเข้า
จากนั้นเรียกใช้กระบวนการจดจำข้อความโดยคลิกที่ปุ่ม "เริ่ม OCR!"
- ในตอนท้ายของการประมวลผลไฟล์ดูผลลัพธ์ในฟิลด์ผลลัพธ์ OCR'ed แล้วคลิก "ดาวน์โหลด" เพื่อดาวน์โหลดเอกสาร TXT สำเร็จรูป
หากคุณเพียงแค่ต้องแยกข้อความจาก PDF และในเวลาเดียวกันการจัดรูปแบบสุดท้ายมันไม่สำคัญเลย OCR.Space เป็นตัวเลือกที่ดี เพียงคนเดียวเอกสารต้องเป็น "พูดเดี่ยว" เนื่องจากการรับรู้ของสองภาษาขึ้นไปพร้อมกันในการให้บริการ
อ่านเพิ่มเติม: Finereader ฟรี analogues
การประเมินเครื่องมือออนไลน์ที่นำเสนอในบทความควรสังเกตว่า Finereader ออนไลน์จาก Abbyy นั้นแม่นยำที่สุดและมีคุณภาพด้วยฟังก์ชั่น OCR หากคุณมีความสำคัญต่อความผิดปกติสูงสุดของการจดจำข้อความจึงเป็นการดีที่สุดที่จะพิจารณาเฉพาะตัวเลือกนี้ แต่พวกเขาจะจ่ายให้เขามากที่สุด
หากคุณต้องการเอกสารขนาดเล็กดิจิทัลและคุณพร้อมที่จะแก้ไขข้อผิดพลาดบริการที่ถูกต้องขอแนะนำให้ใช้ NEWOCR, OCR.Space หรือ OCR ออนไลน์ฟรี