Δεν μπορείτε πάντα να αφαιρέσετε το κείμενο από το αρχείο PDF χρησιμοποιώντας τη συνήθη μέθοδο αντιγραφής. Συχνά, οι σελίδες τέτοιων εγγράφων είναι το σαρωμένο περιεχόμενο των επιλογών χαρτιού τους. Για να μετατρέψετε τέτοια αρχεία σε πλήρως επεξεργάσιμα δεδομένα κειμένου, χρησιμοποιούνται ειδικά προγράμματα με τη λειτουργία αναγνώρισης οπτικού χαρακτήρα (OCR).
Τέτοιες αποφάσεις είναι πολύ πολύπλοκες στις πωλήσεις και, ως εκ τούτου, υπάρχουν σημαντικά χρήματα. Εάν η ανάγκη για αναγνώριση κειμένου με το PDF προκύψει τακτικά, θα είναι σκόπιμο να αγοράσετε το κατάλληλο πρόγραμμα. Για σπάνιες περιπτώσεις, μία από τις διαθέσιμες ηλεκτρονικές υπηρεσίες με παρόμοια χαρακτηριστικά θα είναι πιο λογική.
Πώς να αναγνωρίσετε το κείμενο με το PDF Online
Φυσικά, ένα σύνολο χαρακτηριστικών των OCR Online Services, σε σύγκριση με πλήρως εξοπλισμένες λύσεις Desktop, είναι πιο περιορισμένη. Αλλά είναι δυνατό να συνεργαστείτε με τέτοιους πόρους ή εντελώς δωρεάν ή για συμβολική αμοιβή. Το κύριο πράγμα είναι ότι με το κύριο καθήκον της, δηλαδή, με την αναγνώριση του κειμένου, οι αντίστοιχες εφαρμογές ιστού θα αντιμετωπίσουν επίσης.Μέθοδος 1: ABBYY FineReader Online
Η εταιρεία Developer Service είναι ένας από τους ηγέτες στον τομέα της οπτικής αναγνώρισης των εγγράφων. Το ABBYY FineReader για τα Windows και Mac είναι μια ισχυρή λύση για τη μετατροπή του PDF σε κείμενο και περαιτέρω εργασία με αυτό.
Το ανάλογο Web του προγράμματος, φυσικά, είναι κατώτερη από αυτήν με λειτουργικότητα. Παρ 'όλα αυτά, η υπηρεσία μπορεί να αναγνωρίσει το κείμενο από σαρώσεις και φωτογραφίες σε περισσότερες από 190 γλώσσες. Υποστηριζόμενη μετατροπή αρχείου PDF σε Word, Excel Documents, κλπ.
Online υπηρεσία ABBYY FineReader Online
- Πριν αρχίσετε να εργάζεστε με ένα εργαλείο, δημιουργήστε έναν λογαριασμό στον ιστότοπο ή συνδεθείτε με το λογαριασμό Facebook, Google ή Microsoft.
Για να μεταβείτε στο παράθυρο εξουσιοδότησης, κάντε κλικ στο κουμπί "Σύνδεση" στον επάνω πίνακα μενού.
- Με τη σύνδεση, εισάγετε το επιθυμητό έγγραφο PDF στο FineReader, χρησιμοποιώντας το κουμπί "Λήψη αρχείων".
Στη συνέχεια, κάντε κλικ στην επιλογή "Επιλογή αριθμών σελίδων" και καθορίστε το επιθυμητό κενό για να αναγνωρίσετε το κείμενο.
- Στη συνέχεια, επιλέξτε τις γλώσσες που υπάρχουν στο έγγραφο, τη μορφή αρχείου έκβασης και κάντε κλικ στο κουμπί "Αναγνωρίστε".
- Μετά την επεξεργασία, η διάρκεια της οποίας εξαρτάται εξ ολοκλήρου από το ποσό του εγγράφου, μπορείτε να κατεβάσετε ένα έτοιμο αρχείο με δεδομένα κειμένου απλά κάνοντας κλικ στο όνομα του.
Είτε το εξάγετε σε μία από τις διαθέσιμες υπηρεσίες Cloud.
Η υπηρεσία είναι ίσως οι πιο ακριβείς αλγορίθμοι αναγνώρισης κειμένου σε εικόνες και αρχεία PDF. Αλλά, δυστυχώς, η δωρεάν χρήση του περιορίζεται σε πέντε επεξεργασμένες σελίδες ανά μήνα. Για να συνεργαστείτε με περισσότερα ογκώδη έγγραφα, θα πρέπει να αγοράσετε μια ετήσια συνδρομή.
Ωστόσο, εάν απαιτείται η λειτουργία OCR αρκετά σπάνια, η ABBYY FineReader Online είναι μια εξαιρετική επιλογή για να εξαγάγετε κείμενο από μικρά αρχεία PDF.
Μέθοδος 2: Δωρεάν Online OCR
Απλό και βολικό κείμενο ψηφιοποίησης κειμένου. Χωρίς την ανάγκη εγγραφής, ο πόρος σας επιτρέπει να αναγνωρίσετε 15 πλήρεις σελίδες PDF ανά ώρα. Δωρεάν OCR OCR πλήρως λειτουργεί με έγγραφα σε 46 γλώσσες και χωρίς εξουσιοδότηση υποστηρίζει τρεις εξαγωγές κειμένου - DOCX, XLSX και TXT.
Κατά την εγγραφή, ο χρήστης έχει την ευκαιρία να επεξεργαστεί τα έγγραφα πολλών σελίδων, ωστόσο, ο ελεύθερος αριθμός αυτών των σελίδων περιορίζεται σε 50 μονάδες.
Online υπηρεσία δωρεάν online ocr
- Για να αναγνωρίσετε το κείμενο από το PDF ως "επισκέπτης", χωρίς εξουσιοδότηση στον πόρο, χρησιμοποιήστε την κατάλληλη φόρμα στην κύρια σελίδα του ιστότοπου.
Επιλέξτε το επιθυμητό έγγραφο χρησιμοποιώντας το κουμπί αρχείου, καθορίστε την κύρια γλώσσα του κειμένου, της μορφής εξόδου και, στη συνέχεια, περιμένετε να κατεβάσετε το αρχείο και κάντε κλικ στο Μετατροπή.
- Στο τέλος της διαδικασίας ψηφιοποίησης, κάντε κλικ στο κουμπί "Λήψη αρχείου εξόδου" για να αποθηκεύσετε το τελικό έγγραφο με το κείμενο στον υπολογιστή.
Για τους εξουσιοδοτημένους χρήστες, η ακολουθία των ενεργειών είναι κάπως διαφορετική.
- Χρησιμοποιήστε το κουμπί "Εγγραφή" ή "Σύνδεση" στον επάνω πίνακα μενού σε αντίστοιχα, δημιουργήστε ένα δωρεάν online λογαριασμό OCR ή πηγαίνετε σε αυτό.
- Μετά την εξουσιοδότηση στον πίνακα αναγνώρισης, κρατώντας το πλήκτρο "CTRL", επιλέξτε έως δύο γλώσσες του εγγράφου πηγής από την προτεινόμενη λίστα.
- Καθορίστε περαιτέρω παραμέτρους εξαγωγής κειμένου από το PDF και κάντε κλικ στο κουμπί Επιλογή αρχείου για να κάνετε λήψη του εγγράφου στην υπηρεσία.
Στη συνέχεια, για να προχωρήσετε στην αναγνώριση, κάντε κλικ στην επιλογή "Μετατροπή".
- Στο τέλος της επεξεργασίας του εγγράφου, κάντε κλικ στο σύνδεσμο που ονομάζεται αρχείο εξόδου στην κατάλληλη στήλη.
Το αποτέλεσμα της αναγνώρισης θα αποθηκευτεί αμέσως στη μνήμη του υπολογιστή σας.
Εάν είναι απαραίτητο, η αφαίρεση του κειμένου από ένα μικρό έγγραφο PDF μπορεί να είναι ασφαλές να καταφύγει στη χρήση του εργαλείου που περιγράφεται παραπάνω. Για να συνεργαστείτε με ογκώδη αρχεία, θα πρέπει να αγοράσετε επιπλέον χαρακτήρες σε δωρεάν online OCR ή θέρετρο σε άλλη λύση.
Μέθοδος 3: NEWOC
Πλήρως δωρεάν υπηρεσία OCR που σας επιτρέπει να εξαγάγετε κείμενο από σχεδόν οποιαδήποτε γραφικά και ηλεκτρονικά έγγραφα όπως το DJVU και το PDF. Ο πόρος δεν επιβάλλει περιορισμούς στο μέγεθος και τον αριθμό των αναγνωρίσιμων αρχείων, δεν απαιτεί εγγραφή και προσφέρει ένα ευρύ φάσμα σχετικών λειτουργιών.
Ο Newoc υποστηρίζει 106 γλώσσες και μπορεί να επεξεργαστεί σωστά ακόμα και χαμηλού ποιότητας σαρώνες εγγράφων. Είναι δυνατή η μη αυτόματη επιλογή της περιοχής αναγνώρισης κειμένου στη σελίδα Αρχείου.
Online υπηρεσία Newoc
- Έτσι, μπορείτε να αρχίσετε να εργάζεστε με έναν πόρο αμέσως, χωρίς την ανάγκη να εκτελέσετε επιπλέον ενέργειες.
Ακριβώς στην κύρια σελίδα υπάρχει μια φόρμα για την εισαγωγή εγγράφου στον ιστότοπο. Για να κάνετε λήψη του αρχείου στο Newoc, χρησιμοποιήστε το κουμπί επιλογής αρχείου στην ενότητα Επιλογή αρχείου. Στη συνέχεια, στο πεδίο "Γλώσσα αναγνώρισης", καθορίστε μία ή περισσότερες γλώσσες προέλευσης εγγράφων και, στη συνέχεια, κάντε κλικ στην επιλογή "Upload + OCR".
- Καθορίστε τις ρυθμίσεις αναγνώρισης που προτιμάτε, επιλέξτε την επιθυμητή σελίδα για να ανακτήσετε το κείμενο και κάντε κλικ στο κουμπί OCR.
- Μετακινηθείτε προς τα κάτω τη σελίδα προς τα κάτω και βρείτε το κουμπί "Λήψη".
Κάντε κλικ σε αυτό και στην αναπτυσσόμενη λίστα, επιλέξτε την επιθυμητή μορφή του εγγράφου για λήψη. Μετά από αυτό, το τελικό αρχείο με το εξαγόμενο κείμενο θα μεταφορτωθεί στον υπολογιστή σας.
Το εργαλείο είναι βολικό και αρκετά καλά αναγνωρίζει όλους τους χαρακτήρες. Ωστόσο, η επεξεργασία κάθε σελίδας του εισαγόμενου εγγράφου PDF πρέπει να ξεκινήσει ανεξάρτητα και εμφανίζεται σε ξεχωριστό αρχείο. Μπορείτε, φυσικά, να αντιγράψετε αμέσως την αναγνώριση των αποτελεσμάτων στο πρόχειρο και να τα συνδυάσετε με άλλους.
Παρ 'όλα αυτά, δεδομένης της ανωτέρω περιγραφέντης απόχρωμν Με τα μικρά αρχεία, οι αγορές υπηρεσιών "με ένα κτύπημα".
Μέθοδος 4: OCR.Space
Ένας απλός και κατανοητός πόρος για ψηφιοποίηση κειμένου σας επιτρέπει να αναγνωρίσετε τα έγγραφα PDF και να εξάγετε το αποτέλεσμα στο αρχείο txt. Δεν υπάρχουν όρια στον αριθμό των σελίδων. Ο μόνος περιορισμός είναι το μέγεθος του εγγράφου εισόδου δεν πρέπει να υπερβαίνει τα 5 megabytes.
Online υπηρεσία OCR.Space
- Δεν χρειάζεται να εγγραφείτε για να συνεργαστείτε με το εργαλείο.
Απλά κάντε κλικ στον σύνδεσμο παραπάνω και κατεβάστε το έγγραφο PDF στην περιοχή από τον υπολογιστή χρησιμοποιώντας το κουμπί "Επιλογή αρχείου" ή από το δίκτυο με αναφορά.
- Στην αναπτυσσόμενη λίστα "Επιλογή OCR", επιλέξτε τη γλώσσα του εισαγόμενου εγγράφου.
Στη συνέχεια, εκτελέστε τη διαδικασία αναγνώρισης κειμένου κάνοντας κλικ στο κουμπί "Έναρξη OCR!".
- Στο τέλος της επεξεργασίας αρχείων, δείτε το αποτέλεσμα στο πεδίο αποτελεσμάτων OCRED και κάντε κλικ στο "Λήψη" για να κάνετε λήψη του τελικού εγγράφου TXT.
Εάν απλά πρέπει να εξαγάγετε κείμενο από το PDF και ταυτόχρονα την τελική μορφοποίηση που δεν είναι καθόλου, η OCR.Space είναι μια καλή επιλογή. Το μόνο, το έγγραφο πρέπει να είναι "μονοφωνία", δεδομένου ότι η αναγνώριση δύο ή περισσοτέρων γλωσσών ταυτόχρονα στην υπηρεσία δεν παρέχεται.
Διαβάστε επίσης: FineReader δωρεάν ανάλογα
Η αξιολόγηση των ηλεκτρονικών μέσων που παρουσιάζονται στο άρθρο πρέπει να σημειωθεί ότι ο FineReader online από την ABBYY είναι πιο ακριβής και ποιοτικά με τη λειτουργία OCR. Εάν είστε σημαντικοί για εσάς τη μέγιστη παραμόρφωση της αναγνώρισης κειμένου, είναι καλύτερο να εξετάσετε συγκεκριμένα αυτή την επιλογή. Αλλά πιθανότατα θα πληρώσουν γι 'αυτόν.
Εάν χρειάζεστε ψηφιοποίηση μικρών εγγράφων και είστε έτοιμοι να διορθώσετε σωστά τα σφάλματα εξυπηρέτησης, συνιστάται να χρησιμοποιήσετε το NewoCr, OCR.Space ή δωρεάν online OCR.