Πώς να αναγνωρίσετε το αρχείο PDF online

Anonim

Πώς να αναγνωρίσετε το αρχείο PDF online

Δεν μπορείτε πάντα να αφαιρέσετε το κείμενο από το αρχείο PDF χρησιμοποιώντας τη συνήθη μέθοδο αντιγραφής. Συχνά, οι σελίδες τέτοιων εγγράφων είναι το σαρωμένο περιεχόμενο των επιλογών χαρτιού τους. Για να μετατρέψετε τέτοια αρχεία σε πλήρως επεξεργάσιμα δεδομένα κειμένου, χρησιμοποιούνται ειδικά προγράμματα με τη λειτουργία αναγνώρισης οπτικού χαρακτήρα (OCR).

Τέτοιες αποφάσεις είναι πολύ πολύπλοκες στις πωλήσεις και, ως εκ τούτου, υπάρχουν σημαντικά χρήματα. Εάν η ανάγκη για αναγνώριση κειμένου με το PDF προκύψει τακτικά, θα είναι σκόπιμο να αγοράσετε το κατάλληλο πρόγραμμα. Για σπάνιες περιπτώσεις, μία από τις διαθέσιμες ηλεκτρονικές υπηρεσίες με παρόμοια χαρακτηριστικά θα είναι πιο λογική.

Πώς να αναγνωρίσετε το κείμενο με το PDF Online

Φυσικά, ένα σύνολο χαρακτηριστικών των OCR Online Services, σε σύγκριση με πλήρως εξοπλισμένες λύσεις Desktop, είναι πιο περιορισμένη. Αλλά είναι δυνατό να συνεργαστείτε με τέτοιους πόρους ή εντελώς δωρεάν ή για συμβολική αμοιβή. Το κύριο πράγμα είναι ότι με το κύριο καθήκον της, δηλαδή, με την αναγνώριση του κειμένου, οι αντίστοιχες εφαρμογές ιστού θα αντιμετωπίσουν επίσης.

Μέθοδος 1: ABBYY FineReader Online

Η εταιρεία Developer Service είναι ένας από τους ηγέτες στον τομέα της οπτικής αναγνώρισης των εγγράφων. Το ABBYY FineReader για τα Windows και Mac είναι μια ισχυρή λύση για τη μετατροπή του PDF σε κείμενο και περαιτέρω εργασία με αυτό.

Το ανάλογο Web του προγράμματος, φυσικά, είναι κατώτερη από αυτήν με λειτουργικότητα. Παρ 'όλα αυτά, η υπηρεσία μπορεί να αναγνωρίσει το κείμενο από σαρώσεις και φωτογραφίες σε περισσότερες από 190 γλώσσες. Υποστηριζόμενη μετατροπή αρχείου PDF σε Word, Excel Documents, κλπ.

Online υπηρεσία ABBYY FineReader Online

  1. Πριν αρχίσετε να εργάζεστε με ένα εργαλείο, δημιουργήστε έναν λογαριασμό στον ιστότοπο ή συνδεθείτε με το λογαριασμό Facebook, Google ή Microsoft.

    Εγγραφή στην ηλεκτρονική υπηρεσία ABBYY FineReader Online

    Για να μεταβείτε στο παράθυρο εξουσιοδότησης, κάντε κλικ στο κουμπί "Σύνδεση" στον επάνω πίνακα μενού.

  2. Με τη σύνδεση, εισάγετε το επιθυμητό έγγραφο PDF στο FineReader, χρησιμοποιώντας το κουμπί "Λήψη αρχείων".

    Αναγνώριση κειμένου από το έγγραφο PDF στην ηλεκτρονική υπηρεσία ABBYY FineReader Online

    Στη συνέχεια, κάντε κλικ στην επιλογή "Επιλογή αριθμών σελίδων" και καθορίστε το επιθυμητό κενό για να αναγνωρίσετε το κείμενο.

  3. Στη συνέχεια, επιλέξτε τις γλώσσες που υπάρχουν στο έγγραφο, τη μορφή αρχείου έκβασης και κάντε κλικ στο κουμπί "Αναγνωρίστε".

    Έναρξη της αναγνώρισης κειμένου από το έγγραφο PDF στο ABBYY FineReader Online

  4. Μετά την επεξεργασία, η διάρκεια της οποίας εξαρτάται εξ ολοκλήρου από το ποσό του εγγράφου, μπορείτε να κατεβάσετε ένα έτοιμο αρχείο με δεδομένα κειμένου απλά κάνοντας κλικ στο όνομα του.

    Λήψη ενός τελικού εγγράφου από την ηλεκτρονική υπηρεσία ABBYY FineReader Online

    Είτε το εξάγετε σε μία από τις διαθέσιμες υπηρεσίες Cloud.

Η υπηρεσία είναι ίσως οι πιο ακριβείς αλγορίθμοι αναγνώρισης κειμένου σε εικόνες και αρχεία PDF. Αλλά, δυστυχώς, η δωρεάν χρήση του περιορίζεται σε πέντε επεξεργασμένες σελίδες ανά μήνα. Για να συνεργαστείτε με περισσότερα ογκώδη έγγραφα, θα πρέπει να αγοράσετε μια ετήσια συνδρομή.

Ωστόσο, εάν απαιτείται η λειτουργία OCR αρκετά σπάνια, η ABBYY FineReader Online είναι μια εξαιρετική επιλογή για να εξαγάγετε κείμενο από μικρά αρχεία PDF.

Μέθοδος 2: Δωρεάν Online OCR

Απλό και βολικό κείμενο ψηφιοποίησης κειμένου. Χωρίς την ανάγκη εγγραφής, ο πόρος σας επιτρέπει να αναγνωρίσετε 15 πλήρεις σελίδες PDF ανά ώρα. Δωρεάν OCR OCR πλήρως λειτουργεί με έγγραφα σε 46 γλώσσες και χωρίς εξουσιοδότηση υποστηρίζει τρεις εξαγωγές κειμένου - DOCX, XLSX και TXT.

Κατά την εγγραφή, ο χρήστης έχει την ευκαιρία να επεξεργαστεί τα έγγραφα πολλών σελίδων, ωστόσο, ο ελεύθερος αριθμός αυτών των σελίδων περιορίζεται σε 50 μονάδες.

Online υπηρεσία δωρεάν online ocr

  1. Για να αναγνωρίσετε το κείμενο από το PDF ως "επισκέπτης", χωρίς εξουσιοδότηση στον πόρο, χρησιμοποιήστε την κατάλληλη φόρμα στην κύρια σελίδα του ιστότοπου.

    Αναγνώριση PDF σε απευθείας σύνδεση δωρεάν OCR

    Επιλέξτε το επιθυμητό έγγραφο χρησιμοποιώντας το κουμπί αρχείου, καθορίστε την κύρια γλώσσα του κειμένου, της μορφής εξόδου και, στη συνέχεια, περιμένετε να κατεβάσετε το αρχείο και κάντε κλικ στο Μετατροπή.

  2. Στο τέλος της διαδικασίας ψηφιοποίησης, κάντε κλικ στο κουμπί "Λήψη αρχείου εξόδου" για να αποθηκεύσετε το τελικό έγγραφο με το κείμενο στον υπολογιστή.

    Φόρτωση αναγνώρισης κειμένου Αποτελέσματα με PDF από δωρεάν Online OCR Online Service

Για τους εξουσιοδοτημένους χρήστες, η ακολουθία των ενεργειών είναι κάπως διαφορετική.

  1. Χρησιμοποιήστε το κουμπί "Εγγραφή" ή "Σύνδεση" στον επάνω πίνακα μενού σε αντίστοιχα, δημιουργήστε ένα δωρεάν online λογαριασμό OCR ή πηγαίνετε σε αυτό.

    Δημιουργία λογαριασμού στο Online Free Online OCR

  2. Μετά την εξουσιοδότηση στον πίνακα αναγνώρισης, κρατώντας το πλήκτρο "CTRL", επιλέξτε έως δύο γλώσσες του εγγράφου πηγής από την προτεινόμενη λίστα.

    Ορισμός των γλωσσών του εγγράφου πηγής για την αναγνώριση κειμένου Σε δωρεάν online OCR

  3. Καθορίστε περαιτέρω παραμέτρους εξαγωγής κειμένου από το PDF και κάντε κλικ στο κουμπί Επιλογή αρχείου για να κάνετε λήψη του εγγράφου στην υπηρεσία.

    Έναρξη της αναγνώρισης εγγράφων PDF στην ηλεκτρονική υπηρεσία δωρεάν online OCR

    Στη συνέχεια, για να προχωρήσετε στην αναγνώριση, κάντε κλικ στην επιλογή "Μετατροπή".

  4. Στο τέλος της επεξεργασίας του εγγράφου, κάντε κλικ στο σύνδεσμο που ονομάζεται αρχείο εξόδου στην κατάλληλη στήλη.

    Λήψη του τελικού αρχείου DOCX από την δωρεάν online υπηρεσία OCR OCR

    Το αποτέλεσμα της αναγνώρισης θα αποθηκευτεί αμέσως στη μνήμη του υπολογιστή σας.

Εάν είναι απαραίτητο, η αφαίρεση του κειμένου από ένα μικρό έγγραφο PDF μπορεί να είναι ασφαλές να καταφύγει στη χρήση του εργαλείου που περιγράφεται παραπάνω. Για να συνεργαστείτε με ογκώδη αρχεία, θα πρέπει να αγοράσετε επιπλέον χαρακτήρες σε δωρεάν online OCR ή θέρετρο σε άλλη λύση.

Μέθοδος 3: NEWOC

Πλήρως δωρεάν υπηρεσία OCR που σας επιτρέπει να εξαγάγετε κείμενο από σχεδόν οποιαδήποτε γραφικά και ηλεκτρονικά έγγραφα όπως το DJVU και το PDF. Ο πόρος δεν επιβάλλει περιορισμούς στο μέγεθος και τον αριθμό των αναγνωρίσιμων αρχείων, δεν απαιτεί εγγραφή και προσφέρει ένα ευρύ φάσμα σχετικών λειτουργιών.

Ο Newoc υποστηρίζει 106 γλώσσες και μπορεί να επεξεργαστεί σωστά ακόμα και χαμηλού ποιότητας σαρώνες εγγράφων. Είναι δυνατή η μη αυτόματη επιλογή της περιοχής αναγνώρισης κειμένου στη σελίδα Αρχείου.

Online υπηρεσία Newoc

  1. Έτσι, μπορείτε να αρχίσετε να εργάζεστε με έναν πόρο αμέσως, χωρίς την ανάγκη να εκτελέσετε επιπλέον ενέργειες.

    Φόρτωση του αρχείου PDF για να αναγνωρίσετε την ηλεκτρονική υπηρεσία Newoc

    Ακριβώς στην κύρια σελίδα υπάρχει μια φόρμα για την εισαγωγή εγγράφου στον ιστότοπο. Για να κάνετε λήψη του αρχείου στο Newoc, χρησιμοποιήστε το κουμπί επιλογής αρχείου στην ενότητα Επιλογή αρχείου. Στη συνέχεια, στο πεδίο "Γλώσσα αναγνώρισης", καθορίστε μία ή περισσότερες γλώσσες προέλευσης εγγράφων και, στη συνέχεια, κάντε κλικ στην επιλογή "Upload + OCR".

  2. Καθορίστε τις ρυθμίσεις αναγνώρισης που προτιμάτε, επιλέξτε την επιθυμητή σελίδα για να ανακτήσετε το κείμενο και κάντε κλικ στο κουμπί OCR.

    Ρύθμιση και εκτόξευση αναγνώρισης κειμένου με PDF στην ηλεκτρονική υπηρεσία Newoc

  3. Μετακινηθείτε προς τα κάτω τη σελίδα προς τα κάτω και βρείτε το κουμπί "Λήψη".

    Downloaded στο NewoCr Κείμενο στον υπολογιστή

    Κάντε κλικ σε αυτό και στην αναπτυσσόμενη λίστα, επιλέξτε την επιθυμητή μορφή του εγγράφου για λήψη. Μετά από αυτό, το τελικό αρχείο με το εξαγόμενο κείμενο θα μεταφορτωθεί στον υπολογιστή σας.

Το εργαλείο είναι βολικό και αρκετά καλά αναγνωρίζει όλους τους χαρακτήρες. Ωστόσο, η επεξεργασία κάθε σελίδας του εισαγόμενου εγγράφου PDF πρέπει να ξεκινήσει ανεξάρτητα και εμφανίζεται σε ξεχωριστό αρχείο. Μπορείτε, φυσικά, να αντιγράψετε αμέσως την αναγνώριση των αποτελεσμάτων στο πρόχειρο και να τα συνδυάσετε με άλλους.

Παρ 'όλα αυτά, δεδομένης της ανωτέρω περιγραφέντης απόχρωμν Με τα μικρά αρχεία, οι αγορές υπηρεσιών "με ένα κτύπημα".

Μέθοδος 4: OCR.Space

Ένας απλός και κατανοητός πόρος για ψηφιοποίηση κειμένου σας επιτρέπει να αναγνωρίσετε τα έγγραφα PDF και να εξάγετε το αποτέλεσμα στο αρχείο txt. Δεν υπάρχουν όρια στον αριθμό των σελίδων. Ο μόνος περιορισμός είναι το μέγεθος του εγγράφου εισόδου δεν πρέπει να υπερβαίνει τα 5 megabytes.

Online υπηρεσία OCR.Space

  1. Δεν χρειάζεται να εγγραφείτε για να συνεργαστείτε με το εργαλείο.

    Εισαγωγή αρχείου PDF σε online υπηρεσία OCR.Space

    Απλά κάντε κλικ στον σύνδεσμο παραπάνω και κατεβάστε το έγγραφο PDF στην περιοχή από τον υπολογιστή χρησιμοποιώντας το κουμπί "Επιλογή αρχείου" ή από το δίκτυο με αναφορά.

  2. Στην αναπτυσσόμενη λίστα "Επιλογή OCR", επιλέξτε τη γλώσσα του εισαγόμενου εγγράφου.

    Εκτέλεση της διαδικασίας αναγνώρισης εγγράφων PDF στην ηλεκτρονική υπηρεσία OCR.Space

    Στη συνέχεια, εκτελέστε τη διαδικασία αναγνώρισης κειμένου κάνοντας κλικ στο κουμπί "Έναρξη OCR!".

  3. Στο τέλος της επεξεργασίας αρχείων, δείτε το αποτέλεσμα στο πεδίο αποτελεσμάτων OCRED και κάντε κλικ στο "Λήψη" για να κάνετε λήψη του τελικού εγγράφου TXT.

    Λήψη του αποτελέσματος της αναγνώρισης αρχείου PDF από την υπηρεσία OCR.Space Online

Εάν απλά πρέπει να εξαγάγετε κείμενο από το PDF και ταυτόχρονα την τελική μορφοποίηση που δεν είναι καθόλου, η OCR.Space είναι μια καλή επιλογή. Το μόνο, το έγγραφο πρέπει να είναι "μονοφωνία", δεδομένου ότι η αναγνώριση δύο ή περισσοτέρων γλωσσών ταυτόχρονα στην υπηρεσία δεν παρέχεται.

Διαβάστε επίσης: FineReader δωρεάν ανάλογα

Η αξιολόγηση των ηλεκτρονικών μέσων που παρουσιάζονται στο άρθρο πρέπει να σημειωθεί ότι ο FineReader online από την ABBYY είναι πιο ακριβής και ποιοτικά με τη λειτουργία OCR. Εάν είστε σημαντικοί για εσάς τη μέγιστη παραμόρφωση της αναγνώρισης κειμένου, είναι καλύτερο να εξετάσετε συγκεκριμένα αυτή την επιλογή. Αλλά πιθανότατα θα πληρώσουν γι 'αυτόν.

Εάν χρειάζεστε ψηφιοποίηση μικρών εγγράφων και είστε έτοιμοι να διορθώσετε σωστά τα σφάλματα εξυπηρέτησης, συνιστάται να χρησιμοποιήσετε το NewoCr, OCR.Space ή δωρεάν online OCR.

Διαβάστε περισσότερα