نحوه شناسایی فایل PDF آنلاین

شما همیشه نمی توانید متن را از فایل PDF با استفاده از روش کپی معمول حذف کنید. اغلب صفحات چنین اسناد محتویات اسکن شده از گزینه های کاغذی خود هستند. برای تبدیل چنین فایل هایی به داده های متن کاملا قابل ویرایش، برنامه های ویژه با عملکرد تشخیص کاراکتر نوری (OCR) استفاده می شود.

چنین تصمیماتی در فروش بسیار پیچیده است و بنابراین پول قابل توجهی وجود دارد. اگر نیاز به تشخیص متن با PDF به طور منظم بوجود آید، کاملا توصیه خواهد شد که برنامه مناسب را خریداری کنید. برای موارد نادر، یکی از خدمات آنلاین موجود با ویژگی های مشابه، منطقی تر خواهد بود.

چگونه متن را با PDF آنلاین تشخیص دهیم

البته، مجموعه ای از ویژگی های خدمات OCR Online، در مقایسه با راه حل های دسکتاپ کامل، محدود تر است. اما ممکن است با چنین منابع و یا کاملا رایگان و یا برای هزینه نمادین کار کند. نکته اصلی این است که با وظیفه اصلی آن، یعنی، با شناخت متن، برنامه های کاربردی وب مربوطه نیز مقابله خواهند کرد.

روش 1: Abbyy Finereader آنلاین

شرکت توسعه دهنده خدمات یکی از رهبران در زمینه تشخیص نوری اسناد است. Abbyy Finereader برای ویندوز و مک یک راه حل قدرتمند برای تبدیل PDF به متن و کار بیشتر با آن است.

البته، آنالوگ وب برنامه، البته، با عملکرد آن پایین تر است. با این وجود، این سرویس می تواند متن را از اسکن ها و عکس ها در بیش از 190 زبان تشخیص دهد. تبدیل فایل PDF پشتیبانی شده به ورد، اسناد اکسل، و غیره

خدمات آنلاین Abbyy Finereader آنلاین

قبل از شروع کار با یک ابزار، یک حساب کاربری را در سایت ایجاد کنید یا با حساب فیس بوک، گوگل یا مایکروسافت وارد شوید.

برای رفتن به پنجره مجوز، روی دکمه "ورود به سیستم" در پانل منو بالا کلیک کنید.
با ورود به سیستم، سند مورد نظر PDF را در Finereader وارد کنید، با استفاده از دکمه "دانلود فایل ها".

سپس روی «انتخاب شماره های صفحه» کلیک کنید و شکاف دلخواه را برای تشخیص متن مشخص کنید.
بعد، زبان های موجود در سند را انتخاب کنید، فرمت فایل نتیجه و روی دکمه «تشخیص» کلیک کنید.
پس از پردازش، مدت زمان آن به طور کامل بر مقدار سند بستگی دارد، شما می توانید یک فایل آماده با داده های متن را به سادگی با کلیک کردن بر روی نام آن دانلود کنید.

یا آن را به یکی از خدمات ابر موجود صادر کنید.

این سرویس احتمالا دقیق ترین الگوریتم های تشخیص متن در تصاویر و فایل های PDF است. اما، متاسفانه، استفاده رایگان آن به صفحات پنج فرآوری شده در هر ماه محدود می شود. برای کار با اسناد گسترده تر، شما باید یک اشتراک سالانه خریداری کنید.

با این حال، اگر عملکرد OCR به ندرت مورد نیاز است، Abbyy Finereader آنلاین یک گزینه عالی برای استخراج متن از فایل های PDF کوچک است.

روش 2: OCR آنلاین رایگان

متن ساده و راحت متن دیجیتالی کردن متن. بدون نیاز به ثبت نام، منبع به شما اجازه می دهد تا 15 صفحه کامل PDF را در هر ساعت تشخیص دهید. OCR آنلاین رایگان به طور کامل با اسناد در 46 زبان کار می کند و بدون مجوز پشتیبانی از سه صادرات متن - DOCX، XLSX و TXT.

هنگام ثبت نام، کاربر فرصتی را برای پردازش اسناد چند صفحه ای می گیرد، اما تعداد آزاد این صفحات به 50 واحد محدود می شود.

خدمات آنلاین رایگان آنلاین OCR

برای تشخیص متن از PDF به عنوان "مهمان"، بدون مجوز در منبع، از فرم مناسب در صفحه اصلی سایت استفاده کنید.

سند مورد نظر را با استفاده از دکمه فایل انتخاب کنید، زبان اصلی متن متن، فرمت خروجی را مشخص کنید، سپس منتظر فایل برای دانلود و کلیک کنید.
در پایان فرایند دیجیتالی، روی «دانلود فایل خروجی» کلیک کنید تا سند به پایان رسید با متن بر روی کامپیوتر ذخیره شود.

برای کاربران مجاز، دنباله ای از اقدامات تا حدودی متفاوت است.

از دکمه "ثبت نام" یا "ورود به سیستم" در پانل منو بالا به ترتیب، یک حساب OCR آنلاین رایگان ایجاد کنید یا به آن بروید.
پس از مجوز در پانل به رسمیت شناختن، نگه داشتن کلید "CTRL"، تا دو زبان سند منبع از لیست پیشنهادی را انتخاب کنید.
پارامترهای استخراج متن را از PDF مشخص کنید و روی دکمه Select File کلیک کنید تا سند را به سرویس دانلود کنید.

سپس، برای ادامه به رسمیت شناختن، روی "تبدیل" کلیک کنید.
در پایان پردازش سند، بر روی لینک به نام فایل خروجی در ستون مناسب کلیک کنید.

نتیجه تشخیص بلافاصله در حافظه کامپیوتر شما ذخیره می شود.

در صورت لزوم، متن را از یک سند PDF کوچک حذف کنید، می توانید از استفاده از ابزار توضیح داده شده در بالا استفاده کنید. برای کار با فایل های بزرگ، شما باید برای خرید شخصیت های اضافی در OCR آنلاین رایگان یا رفت و آمد به راه حل دیگری.

روش 3: newoc

سرویس OCR به طور کامل رایگان است که به شما اجازه می دهد تا متن را از تقریبا هر اسناد گرافیکی و الکترونیکی مانند DJVU و PDF استخراج کنید. این منبع محدودیت های اندازه و تعداد فایل های قابل تشخیص را اعمال نمی کند، نیازی به ثبت نام ندارد و طیف گسترده ای از توابع مرتبط را ارائه می دهد.

NEWOCR پشتیبانی از 106 زبان و می تواند به درستی فرایند حتی اسکن با کیفیت پایین اسناد. ممکن است به صورت دستی منطقه تشخیص متن را در صفحه فایل انتخاب کنید.

خدمات آنلاین NEEDOCR

بنابراین، شما می توانید بلافاصله با یک منبع کار کنید، بدون نیاز به انجام اقدامات اضافی.

درست در صفحه اصلی یک فرم برای وارد کردن یک سند به سایت وجود دارد. برای دانلود فایل در NEWOCR، از دکمه SELECT FILE در قسمت انتخاب فایل خود استفاده کنید. سپس در فیلد "تشخیص زبان (S)"، یک یا چند زبان سند منبع را مشخص کنید و سپس روی «آپلود + OCR» کلیک کنید.
تنظیمات تشخیص مورد نظر خود را مشخص کنید، صفحه مورد نظر را برای بازیابی متن انتخاب کنید و روی دکمه OCR کلیک کنید.
صفحه پایین پایین صفحه را پایین بیاورید و دکمه "دانلود" را پیدا کنید.

روی آن کلیک کنید و در لیست کشویی، فرمت مورد نظر سند را برای دانلود انتخاب کنید. پس از آن، فایل به پایان رسید با متن استخراج شده به کامپیوتر شما دانلود می شود.

ابزار راحت است و به خوبی به خوبی تمام کاراکترها را به رسمیت می شناسد. با این حال، پردازش هر صفحه از سند PDF وارد شده باید به طور مستقل راه اندازی شود و در یک فایل جداگانه نمایش داده شود. شما می توانید، البته، بلافاصله نتایج به رسمیت شناختن را به کلیپ بورد کپی کنید و آنها را با دیگران ترکیب کنید.

با این وجود، با توجه به Nuance توصیف شده فوق، حجم زیادی از متن با استفاده از NEEDOCR برای استخراج بسیار دشوار است. با فایل های کوچک، سرویس "با یک انفجار" مقابله می کند.

روش 4: OCR.Space

یک منبع ساده و قابل فهم برای دیجیتال متن اجازه می دهد تا شما را به شناسایی اسناد PDF و خروجی نتیجه در فایل TXT. هیچ محدودیتی در تعداد صفحات ارائه نشده است. تنها محدودیت اندازه سند ورودی نباید بیش از 5 مگابایت باشد.

خدمات آنلاین OCR.SPACE

شما لازم نیست ثبت نام کنید تا با ابزار کار کنید.

فقط بر روی لینک بالا کلیک کنید و سند PDF را به سایت از کامپیوتر با استفاده از دکمه "Select File" یا از شبکه با مرجع دانلود کنید.
در لیست انتخاب OCR انتخاب OCR، زبان سند وارداتی را انتخاب کنید.

سپس فرآیند تشخیص متن را با کلیک بر روی دکمه "شروع OCR!" اجرا کنید.
در پایان پردازش فایل، نتیجه را در فیلد نتیجه OCR'ED مشاهده کنید و روی «دانلود» کلیک کنید تا سند TXT به پایان رسید.

اگر فقط نیاز به استخراج متن از PDF دارید و در عین حال قالب بندی نهایی آن مهم نیست، OCR.SPACE یک انتخاب خوب است. تنها این سند باید "تک حرف" باشد، زیرا شناخت دو یا چند زبان به طور همزمان در سرویس ارائه نشده است.

همچنین بخوانید: آنالوگ های جزئی Finereader

ارزیابی ابزارهای آنلاین ارائه شده در مقاله باید اشاره کرد که Finereader Online از Abbyy دقیق ترین و کیفی با عملکرد OCR است. اگر شما برای شما مهم است حداکثر تغییر شکل پذیری متن، بهتر است به طور خاص این گزینه را در نظر بگیرید. اما آنها به احتمال زیاد برای او پرداخت خواهند کرد.

اگر شما نیاز به دیجیتالی کردن اسناد کوچک دارید و شما آماده به درستی تصحیح خطاهای خدمات هستید، توصیه می شود از NEWOCR، OCR.SPACE یا OCR آنلاین رایگان استفاده کنید.