نحوه شناسایی فایل PDF آنلاین

Anonim

نحوه شناسایی فایل PDF آنلاین

شما همیشه نمی توانید متن را از فایل PDF با استفاده از روش کپی معمول حذف کنید. اغلب صفحات چنین اسناد محتویات اسکن شده از گزینه های کاغذی خود هستند. برای تبدیل چنین فایل هایی به داده های متن کاملا قابل ویرایش، برنامه های ویژه با عملکرد تشخیص کاراکتر نوری (OCR) استفاده می شود.

چنین تصمیماتی در فروش بسیار پیچیده است و بنابراین پول قابل توجهی وجود دارد. اگر نیاز به تشخیص متن با PDF به طور منظم بوجود آید، کاملا توصیه خواهد شد که برنامه مناسب را خریداری کنید. برای موارد نادر، یکی از خدمات آنلاین موجود با ویژگی های مشابه، منطقی تر خواهد بود.

چگونه متن را با PDF آنلاین تشخیص دهیم

البته، مجموعه ای از ویژگی های خدمات OCR Online، در مقایسه با راه حل های دسکتاپ کامل، محدود تر است. اما ممکن است با چنین منابع و یا کاملا رایگان و یا برای هزینه نمادین کار کند. نکته اصلی این است که با وظیفه اصلی آن، یعنی، با شناخت متن، برنامه های کاربردی وب مربوطه نیز مقابله خواهند کرد.

روش 1: Abbyy Finereader آنلاین

شرکت توسعه دهنده خدمات یکی از رهبران در زمینه تشخیص نوری اسناد است. Abbyy Finereader برای ویندوز و مک یک راه حل قدرتمند برای تبدیل PDF به متن و کار بیشتر با آن است.

البته، آنالوگ وب برنامه، البته، با عملکرد آن پایین تر است. با این وجود، این سرویس می تواند متن را از اسکن ها و عکس ها در بیش از 190 زبان تشخیص دهد. تبدیل فایل PDF پشتیبانی شده به ورد، اسناد اکسل، و غیره

خدمات آنلاین Abbyy Finereader آنلاین

  1. قبل از شروع کار با یک ابزار، یک حساب کاربری را در سایت ایجاد کنید یا با حساب فیس بوک، گوگل یا مایکروسافت وارد شوید.

    ثبت نام در خدمات آنلاین Abbyy Finereader آنلاین

    برای رفتن به پنجره مجوز، روی دکمه "ورود به سیستم" در پانل منو بالا کلیک کنید.

  2. با ورود به سیستم، سند مورد نظر PDF را در Finereader وارد کنید، با استفاده از دکمه "دانلود فایل ها".

    تشخیص متن از سند PDF در سرویس آنلاین Abbyy Finereader آنلاین

    سپس روی «انتخاب شماره های صفحه» کلیک کنید و شکاف دلخواه را برای تشخیص متن مشخص کنید.

  3. بعد، زبان های موجود در سند را انتخاب کنید، فرمت فایل نتیجه و روی دکمه «تشخیص» کلیک کنید.

    شروع به تشخیص متن از سند PDF در Abbyy Finereader آنلاین

  4. پس از پردازش، مدت زمان آن به طور کامل بر مقدار سند بستگی دارد، شما می توانید یک فایل آماده با داده های متن را به سادگی با کلیک کردن بر روی نام آن دانلود کنید.

    دانلود یک سند به پایان رسید از سرویس آنلاین Abbyy Finereader آنلاین

    یا آن را به یکی از خدمات ابر موجود صادر کنید.

این سرویس احتمالا دقیق ترین الگوریتم های تشخیص متن در تصاویر و فایل های PDF است. اما، متاسفانه، استفاده رایگان آن به صفحات پنج فرآوری شده در هر ماه محدود می شود. برای کار با اسناد گسترده تر، شما باید یک اشتراک سالانه خریداری کنید.

با این حال، اگر عملکرد OCR به ندرت مورد نیاز است، Abbyy Finereader آنلاین یک گزینه عالی برای استخراج متن از فایل های PDF کوچک است.

روش 2: OCR آنلاین رایگان

متن ساده و راحت متن دیجیتالی کردن متن. بدون نیاز به ثبت نام، منبع به شما اجازه می دهد تا 15 صفحه کامل PDF را در هر ساعت تشخیص دهید. OCR آنلاین رایگان به طور کامل با اسناد در 46 زبان کار می کند و بدون مجوز پشتیبانی از سه صادرات متن - DOCX، XLSX و TXT.

هنگام ثبت نام، کاربر فرصتی را برای پردازش اسناد چند صفحه ای می گیرد، اما تعداد آزاد این صفحات به 50 واحد محدود می شود.

خدمات آنلاین رایگان آنلاین OCR

  1. برای تشخیص متن از PDF به عنوان "مهمان"، بدون مجوز در منبع، از فرم مناسب در صفحه اصلی سایت استفاده کنید.

    تشخیص PDF آنلاین رایگان آنلاین OCR

    سند مورد نظر را با استفاده از دکمه فایل انتخاب کنید، زبان اصلی متن متن، فرمت خروجی را مشخص کنید، سپس منتظر فایل برای دانلود و کلیک کنید.

  2. در پایان فرایند دیجیتالی، روی «دانلود فایل خروجی» کلیک کنید تا سند به پایان رسید با متن بر روی کامپیوتر ذخیره شود.

    بارگیری نتایج تشخیص متن با PDF از خدمات آنلاین OKR آنلاین رایگان آنلاین

برای کاربران مجاز، دنباله ای از اقدامات تا حدودی متفاوت است.

  1. از دکمه "ثبت نام" یا "ورود به سیستم" در پانل منو بالا به ترتیب، یک حساب OCR آنلاین رایگان ایجاد کنید یا به آن بروید.

    ایجاد یک حساب کاربری آنلاین OCR آنلاین رایگان

  2. پس از مجوز در پانل به رسمیت شناختن، نگه داشتن کلید "CTRL"، تا دو زبان سند منبع از لیست پیشنهادی را انتخاب کنید.

    تعریف زبان های سند منبع برای تشخیص متن در OCR آنلاین رایگان

  3. پارامترهای استخراج متن را از PDF مشخص کنید و روی دکمه Select File کلیک کنید تا سند را به سرویس دانلود کنید.

    شروع به تشخیص سند PDF در سرویس آنلاین رایگان آنلاین OCR

    سپس، برای ادامه به رسمیت شناختن، روی "تبدیل" کلیک کنید.

  4. در پایان پردازش سند، بر روی لینک به نام فایل خروجی در ستون مناسب کلیک کنید.

    دانلود فایل DOCX به پایان رسید از سرویس آنلاین OCR آنلاین رایگان

    نتیجه تشخیص بلافاصله در حافظه کامپیوتر شما ذخیره می شود.

در صورت لزوم، متن را از یک سند PDF کوچک حذف کنید، می توانید از استفاده از ابزار توضیح داده شده در بالا استفاده کنید. برای کار با فایل های بزرگ، شما باید برای خرید شخصیت های اضافی در OCR آنلاین رایگان یا رفت و آمد به راه حل دیگری.

روش 3: newoc

سرویس OCR به طور کامل رایگان است که به شما اجازه می دهد تا متن را از تقریبا هر اسناد گرافیکی و الکترونیکی مانند DJVU و PDF استخراج کنید. این منبع محدودیت های اندازه و تعداد فایل های قابل تشخیص را اعمال نمی کند، نیازی به ثبت نام ندارد و طیف گسترده ای از توابع مرتبط را ارائه می دهد.

NEWOCR پشتیبانی از 106 زبان و می تواند به درستی فرایند حتی اسکن با کیفیت پایین اسناد. ممکن است به صورت دستی منطقه تشخیص متن را در صفحه فایل انتخاب کنید.

خدمات آنلاین NEEDOCR

  1. بنابراین، شما می توانید بلافاصله با یک منبع کار کنید، بدون نیاز به انجام اقدامات اضافی.

    بارگیری فایل PDF برای شناسایی خدمات آنلاین NEWOCR

    درست در صفحه اصلی یک فرم برای وارد کردن یک سند به سایت وجود دارد. برای دانلود فایل در NEWOCR، از دکمه SELECT FILE در قسمت انتخاب فایل خود استفاده کنید. سپس در فیلد "تشخیص زبان (S)"، یک یا چند زبان سند منبع را مشخص کنید و سپس روی «آپلود + OCR» کلیک کنید.

  2. تنظیمات تشخیص مورد نظر خود را مشخص کنید، صفحه مورد نظر را برای بازیابی متن انتخاب کنید و روی دکمه OCR کلیک کنید.

    راه اندازی و راه اندازی تشخیص متن با PDF در خدمات آنلاین NEWOCR

  3. صفحه پایین پایین صفحه را پایین بیاورید و دکمه "دانلود" را پیدا کنید.

    دانلود در متن NEWOCR در رایانه یاد بگیرید

    روی آن کلیک کنید و در لیست کشویی، فرمت مورد نظر سند را برای دانلود انتخاب کنید. پس از آن، فایل به پایان رسید با متن استخراج شده به کامپیوتر شما دانلود می شود.

ابزار راحت است و به خوبی به خوبی تمام کاراکترها را به رسمیت می شناسد. با این حال، پردازش هر صفحه از سند PDF وارد شده باید به طور مستقل راه اندازی شود و در یک فایل جداگانه نمایش داده شود. شما می توانید، البته، بلافاصله نتایج به رسمیت شناختن را به کلیپ بورد کپی کنید و آنها را با دیگران ترکیب کنید.

با این وجود، با توجه به Nuance توصیف شده فوق، حجم زیادی از متن با استفاده از NEEDOCR برای استخراج بسیار دشوار است. با فایل های کوچک، سرویس "با یک انفجار" مقابله می کند.

روش 4: OCR.Space

یک منبع ساده و قابل فهم برای دیجیتال متن اجازه می دهد تا شما را به شناسایی اسناد PDF و خروجی نتیجه در فایل TXT. هیچ محدودیتی در تعداد صفحات ارائه نشده است. تنها محدودیت اندازه سند ورودی نباید بیش از 5 مگابایت باشد.

خدمات آنلاین OCR.SPACE

  1. شما لازم نیست ثبت نام کنید تا با ابزار کار کنید.

    وارد کردن فایل پی دی اف در سرویس آنلاین OCR.Space

    فقط بر روی لینک بالا کلیک کنید و سند PDF را به سایت از کامپیوتر با استفاده از دکمه "Select File" یا از شبکه با مرجع دانلود کنید.

  2. در لیست انتخاب OCR انتخاب OCR، زبان سند وارداتی را انتخاب کنید.

    اجرای روند تشخیص سند PDF در سرویس آنلاین OCR.Space

    سپس فرآیند تشخیص متن را با کلیک بر روی دکمه "شروع OCR!" اجرا کنید.

  3. در پایان پردازش فایل، نتیجه را در فیلد نتیجه OCR'ED مشاهده کنید و روی «دانلود» کلیک کنید تا سند TXT به پایان رسید.

    دانلود نتیجه تشخیص فایل PDF از سرویس OCR.Space Online Online

اگر فقط نیاز به استخراج متن از PDF دارید و در عین حال قالب بندی نهایی آن مهم نیست، OCR.SPACE یک انتخاب خوب است. تنها این سند باید "تک حرف" باشد، زیرا شناخت دو یا چند زبان به طور همزمان در سرویس ارائه نشده است.

همچنین بخوانید: آنالوگ های جزئی Finereader

ارزیابی ابزارهای آنلاین ارائه شده در مقاله باید اشاره کرد که Finereader Online از Abbyy دقیق ترین و کیفی با عملکرد OCR است. اگر شما برای شما مهم است حداکثر تغییر شکل پذیری متن، بهتر است به طور خاص این گزینه را در نظر بگیرید. اما آنها به احتمال زیاد برای او پرداخت خواهند کرد.

اگر شما نیاز به دیجیتالی کردن اسناد کوچک دارید و شما آماده به درستی تصحیح خطاهای خدمات هستید، توصیه می شود از NEWOCR، OCR.SPACE یا OCR آنلاین رایگان استفاده کنید.

ادامه مطلب