Metni her zaman PDF dosyasından normal kopyalama yöntemini kullanarak çıkaramazsınız. Genellikle, bu tür belgelerin sayfaları, kağıt seçeneklerinin taranan içeriğidir. Bu dosyaları tamamen düzenlenebilir metin verilerine dönüştürmek için, Optik Karakter Tanıma (OCR) işlevi ile özel programlar kullanılır.
Bu kararlar satışlarda çok karmaşıktır ve bu nedenle, önemli para var. PDF ile metin tanıma ihtiyacı düzenli olarak ortaya çıkarsa, uygun programı satın almak oldukça tavsiye edilir. Nadir durumlarda, benzer özelliklere sahip mevcut çevrimiçi hizmetlerden biri daha mantıklı olacaktır.
PDF Online ile Metin Nasıl Tanınır
Tabii ki, tam teşekküllü masaüstü çözümleriyle karşılaştırıldığında OCR çevrimiçi hizmetlerinin bir dizi özelliği daha sınırlıdır. Ancak bu tür kaynaklarla çalışmak veya tamamen ücretsiz veya sembolik bir ücret karşılığında çalışmak mümkündür. Asıl şey, ana görevi, yani, metnin tanınmasıyla ilgili olarak, ilgili Web uygulamaları da başa çıkacaktır.Yöntem 1: Abbyy FineReader çevrimiçi
Servis geliştirici şirketi, belgelerin optik tanınması alanındaki liderlerden biridir. Windows ve Mac için ABBYY FineReader, PDF'yi metne dönüştürmek için güçlü bir çözümdür ve bununla daha fazla çalışın.
Programın web analogu, elbette, işlevsellik ile onun için aşağı. Bununla birlikte, hizmet, 190'dan fazla dilde taramalardan ve fotoğrafların metnini tanıyabilir. Word, Excel belgeleri vb. İçin Desteklenen PDF dosyası dönüştürme
Çevrimiçi Hizmeti Abbyy FineReader çevrimiçi
- Bir araçla çalışmaya başlamadan önce, sitede bir hesap oluşturun veya Facebook, Google veya Microsoft hesabıyla giriş yapın.
Yetkilendirme penceresine gitmek için, üst menü panelindeki "Giriş" düğmesini tıklayın.
- Giriş yaparak, "Dosyaları İndir" düğmesini kullanarak, FineReader'da istediğiniz PDF belgesini alın.
Ardından "Sayfa numaralarını seçin" seçeneğini tıklayın ve metni tanıma için istediğiniz boşluğu belirtin.
- Ardından, belgede bulunan dilleri, sonuç dosyası biçimini seçin ve "Tanıyın" düğmesine tıklayın.
- İşlemden sonra, süresi tamamen belge miktarına bağlıdır, hazır bir dosyayı yalnızca adını tıklatarak metin verileri ile indirebilirsiniz.
Ya müsait bulut hizmetlerinden birine ver.
Hizmet muhtemelen görüntüler ve PDF dosyalarındaki en doğru metin tanıma algoritmalarıdır. Ancak, ne yazık ki, ücretsiz kullanımı ayda beş işlenmiş sayfalarla sınırlıdır. Daha hacimli belgelerle çalışmak için, yıllık bir abonelik satın almanız gerekir.
Bununla birlikte, OCR işlevi oldukça nadir görülürse, Abbyy FineReader Online, küçük PDF dosyalarından metin çıkarmak için mükemmel bir seçenektir.
Yöntem 2: ücretsiz çevrimiçi OCR
Metni sayısallaştırıcı basit ve kullanışlı metin. Kaydolma ihtiyacı olmadan, kaynak, saatte 15 tam PDF sayfasını tanımanıza izin verir. Ücretsiz çevrimiçi OCR, 46 dilde belgelerle tamamen çalışır ve yetkilendirmeden üç metin ihracatını destekler - DOCX, XLSX ve TXT.
Kayıt olurken, kullanıcı çok sayfalı belgeleri işleme fırsatını alır, ancak bu sayfaların ücretsiz sayısı 50 birim ile sınırlıdır.
Çevrimiçi Hizmet Ücretsiz Online OCR
- PDF'den bir "misafir" olarak metnini tanımak için, kaynak üzerine yetki vermeden, sitenin ana sayfasında uygun formu kullanın.
Dosya düğmesini kullanarak istediğiniz belgeyi seçin, metnin ana dilini, çıkış biçimini belirtin, ardından dosyanın indirilmesini ve Dönüştürmeyi tıklatın.
- Sayısallaştırma işleminin sonunda, bitmiş belgeyi bilgisayardaki metni kaydetmek için "Çıktı Dosyasını İndir" ı tıklayın.
Yetkili kullanıcılar için, eylemlerin sırası biraz farklıdır.
- Sırasıyla üst menü panelindeki "Kayıt Ol" veya "Giriş" düğmesini kullanın, ücretsiz bir çevrimiçi OCR hesabı oluşturun veya buna gidin.
- Tanıma panelinde yetkilendirmeden sonra, "CTRL" tuşunu basılı tutarak, önerilen listeden kaynak belgenin en fazla iki dilini seçin.
- PDF'den daha fazla metin çıkarma parametreleri belirtin ve belgeyi servise indirmek için Dosya Seç düğmesini tıklayın.
Sonra, tanınmaya devam etmek için "Dönüştür" ı tıklayın.
- Belgenin işlenmesinin sonunda, uygun sütundaki çıkış dosyası adı verilen bağlantıya tıklayın.
Tanıma sonucu derhal bilgisayarınızın hafızasına kaydedilecektir.
Gerekirse, küçük bir PDF belgesinden metni kaldırmak, yukarıda açıklanan aracın kullanımına başvurmak için güvenli olabilir. Hacimli dosyalarla çalışmak için, ücretsiz çevrimiçi OCR veya Resort'ta başka bir çözüme ek bir karakter satın almanız gerekir.
Yöntem 3: Newocs
Tam ücretsiz OCR servisi, DJVU ve PDF gibi hemen hemen her grafik ve elektronik belgelerden metin çıkarmanıza olanak tanır. Kaynak, tanınabilir dosyaların boyutu ve sayısına kısıtlamalar getirmez, kayıt gerektirmez ve çok çeşitli işlevler sunar.
NewOC, 106 dilini destekler ve düşük kaliteli belgelerin taramalarını bile doğru şekilde işleyebilir. Dosya sayfasındaki metin tanıma alanını manuel olarak seçmek mümkündür.
Online Hizmeti Newocr
- Böylece, ekstra eylemler yapmanız gerekmeden derhal bir kaynakla çalışmaya başlayabilirsiniz.
Sağ ana sayfada, bir belgeyi siteye içe aktarmak için bir form var. Dosyayı newocr dosyasını indirmek için, Dosya bölümünüzdeki Dosya Seç düğmesini kullanın. Daha sonra "Tanıma Dil (S)" alanında, bir veya daha fazla kaynak belge dilini belirtin ve sonra "Yükle + OCR" ı tıklatın.
- Tercih ettiğiniz tanıma ayarlarınızı belirtin, metni almak için istediğiniz sayfayı seçin ve OCR düğmesine tıklayın.
- Sayfayı hafifçe aşağıya doğru kaydırın ve "İndir" düğmesini bulun.
Ona tıklayın ve açılır listede, indirmek için belgenin istediğiniz formatını seçin. Bundan sonra, ekstrakte edilen metinle bitmiş dosya bilgisayarınıza indirilecektir.
Alet uygun ve oldukça iyi tüm karakterleri tanır. Bununla birlikte, ithal edilen PDF belgesinin her sayfasının işlenmesi bağımsız olarak başlatılmalıdır ve ayrı bir dosyada görüntülenmelidir. Elbette, tanıma sonuçlarını hemen panoya kopyalayabilir ve bunları başkalarıyla birleştirebilirsiniz.
Bununla birlikte, yukarıda tarif edilen nüans, Newocs kullanılarak çok zor bir şekilde, büyük miktarda metin verilir. Küçük dosyalarla, servis "bir patlama ile" kopar.
Yöntem 4: OCR.SPACE
Metin sayısallaştırması için basit ve anlaşılır bir kaynak, PDF belgelerini tanımanıza ve sonucu TXT dosyasındaki çıktılar. Sayfa sayısındaki limit verilmez. Tek sınırlama, giriş belgesinin boyutu 5 megabayt'ı geçmemelidir.
Çevrimiçi Servis OCR.SPACE
- Araçla çalışmak için kayıt olmanız gerekmez.
Yukarıdaki bağlantıya tıklayın ve PDF belgesini "Dosya'yı seçin" düğmesini veya ağdan referans kullanarak bilgisayardan siteye indirin.
- OCR Dil açılır listesinde, içe aktarılan belgenin dilini seçin.
Ardından "OCR'yi Başlat!" Düğmesine tıklayarak metin tanıma işlemini çalıştırın.
- Dosya işlemenin sonunda, OCR'ED sonuç alanındaki sonuca bakın ve bitmiş txt belgesini indirmek için "İndir" i tıklayın.
Sadece PDF'den metin çıkarmanız gerekiyorsa ve aynı zamanda nihai biçimlendirme, hiç önemli değil, OCR.SPACE iyi bir seçimdir. Belge tek veya daha fazla dilin aynı anda tanınmasından bu yana belge "tek konuşma" olmalıdır.
Ayrıca oku: FineReader ücretsiz analoglar
Makalede sunulan çevrimiçi enstrümanların değerlendirilmesi, ABBYY'den çevrimiçi olan FineReader'ın OCR işleviyle en doğru ve niteliksel olarak olduğuna dikkat edilmelidir. Metin tanınmasının maksimum deformitesi sizin için önemliyseniz, özellikle bu seçeneği dikkate almak en iyisidir. Ama büyük olasılıkla onun için para ödeyecekler.
Küçük belgelerin sayısallaştırılmasına ihtiyacınız olursa ve servis hatalarını doğru şekilde doğru şekilde doğru şekilde doğrulamaya hazırsanız, Newocr, OCR.space veya ücretsiz çevrimiçi OCR kullanmanız önerilir.