So erkennen Sie die PDF-Datei online

Anonim

So erkennen Sie die PDF-Datei online

Sie können den Text nicht immer mit der üblichen Kopiermethode aus der PDF-Datei entfernen. Oft sind die Seiten solcher Dokumente der gescannte Inhalt ihrer Papieroptionen. Um solche Dateien auf vollständig bearbeitbare Textdaten zu konvertieren, werden spezielle Programme mit der Funktion der optischen Zeichenkennung (OCR) verwendet.

Solche Entscheidungen sind im Umsatz sehr komplex und daher gibt es beträchtliches Geld. Wenn die Notwendigkeit einer Texterkennung mit PDF regelmäßig auftritt, ist es ziemlich ratsam, das entsprechende Programm zu erwerben. Für seltene Fälle ist eine der verfügbaren Online-Services mit ähnlichen Funktionen logischer.

So erkennen Sie Text mit PDF online

Natürlich ist ein Satz von Funktionen von OCR-Online-Services im Vergleich zu vollwertigen Desktoplösungen begrenzter. Es ist jedoch möglich, mit solchen Ressourcen oder völlig kostenlos oder für eine symbolische Gebühr zu arbeiten. Die Hauptsache ist, dass mit seiner Hauptaufgabe, nämlich mit der Anerkennung des Textes, die entsprechenden Webanwendungen auch umgehen wird.

Methode 1: ABBYY FINERREADER online

Das Service Developer Company ist einer der Führer im Bereich der optischen Anerkennung von Dokumenten. ABBYY FineReader für Windows und Mac ist eine leistungsstarke Lösung zum Umwandeln von PDF in Text und funktioniert weiter damit.

Das Web-Analogon des Programms ist natürlich durch Funktionalität unterlegen. Trotzdem kann der Dienst den Text von Scans und Fotografien in mehr als 190 Sprachen erkennen. Unterstützte PDF-Dateikonvertierung in Word, Excel-Dokumente usw.

Online-Service ABBYY FINERREADER online

  1. Bevor Sie mit dem Arbeiten mit einem Werkzeug beginnen, erstellen Sie ein Konto auf der Site oder melden Sie sich mit dem Facebook-, Google- oder Microsoft-Konto an.

    Registrierung im Online-Service ABBYY FINERREADER online

    Um zum Berechtigungsfenster zu gelangen, klicken Sie im oberen Menübereich auf die Schaltfläche "Anmelden".

  2. Wenn Sie sich anmelden, importieren Sie das gewünschte PDF-Dokument in FineReader mithilfe der Schaltfläche "Dateien herunterladen".

    Texterkennung aus dem PDF-Dokument im Online-Service ABBYY FINERERAUDER online

    Klicken Sie dann auf "Seitennummern auswählen" und geben Sie den gewünschten Lücke an, um Text zu erkennen.

  3. Wählen Sie anschließend die im Dokument vorhandenen Sprachen, das Ergebnisdateiformat, und klicken Sie auf die Schaltfläche "Erkennen".

    Start der Texterkennung vom PDF-Dokument in ABBYY FINERREADER online

  4. Nach der Verarbeitung, deren Dauer vollständig von der Dokumentmenge abhängt, können Sie eine fertige Datei mit Textdaten herunterladen, indem Sie einfach, indem Sie einfach auf den Namen klicken.

    Herunterladen eines fertigen Dokuments aus dem Online-Service ABBYY FINERREADER online

    Entweder exportieren Sie es an einen der verfügbaren Cloud-Services.

Der Dienst ist wahrscheinlich die genauesten Texterkennungsalgorithmen auf Bildern und PDF-Dateien. Leider ist seine kostenlose Verwendung jedoch auf fünf verarbeitete Seiten pro Monat beschränkt. Um mit mehr voluminösen Dokumenten zu arbeiten, müssen Sie ein jährliches Abonnement kaufen.

Wenn jedoch die OCR-Funktion ziemlich selten benötigt wird, ist ABBYY FINERREADER online eine hervorragende Option, um Text aus kleinen PDF-Dateien zu extrahieren.

Methode 2: Kostenloses Online-OCR

Einfacher und bequemer Text digitalisierender Text. Ohne das Registrieren erforderlich, können Sie mit der Ressource 15 vollständige PDF-Seiten pro Stunde erkennen. Kostenloser Online-OCR funktioniert voll mit Dokumenten in 46 Sprachen und ohne Autorisierung unterstützt drei Textpapiere - docx, xlsx und txt.

Bei der Registrierung erhält der Benutzer die Möglichkeit, mehrseitige Dokumente zu verarbeiten, die freie Nummer dieser Seiten ist jedoch auf 50 Einheiten begrenzt.

Online-Service kostenlos online ocr

  1. Um Text von PDF als "Gast" zu erkennen, verwenden Sie ohne Autorisierung der Ressource das entsprechende Formular auf der Hauptseite der Site.

    PDF-Anerkennung in Online-Online-Online-OCR

    Wählen Sie mit der Taste Datei das gewünschte Dokument aus, geben Sie die Hauptsprache des Textes, das Ausgabeformat an und warten Sie, bis die Datei heruntergeladen wird, und klicken Sie auf Konvertieren.

  2. Klicken Sie am Ende des Digitalisierungsprozesses auf "Ausgabedatei herunterladen", um das fertige Dokument mit dem Text auf dem Computer zu speichern.

    Text-Erkennungsergebnisse mit PDF von Free Online OCR Online Service laden

Für die autorisierten Benutzer ist die Folge von Aktionen etwas anders.

  1. Verwenden Sie die Schaltfläche "Registrieren" oder "Anmelden" im oberen Menüfeld, jeweils ein kostenloses Online-OCR-Konto oder gehen Sie dazu.

    Erstellen eines Kontos in Online-Online-Online-OCR

  2. Halten Sie nach der Ermächtigung im Anerkennungsfeld die Taste "Strg", wählen Sie in der vorgeschlagenen Liste auf zwei Sprachen des Quelldokuments aus.

    Definition der Sprachen des Quelldokuments für Texterkennung in freier Online-OCR

  3. Geben Sie weitere Textsxtraktionsparameter aus PDF an und klicken Sie auf die Schaltfläche Datei auswählen, um das Dokument in den Dienst herunterzuladen.

    Start der PDF-Dokumentenerkennung im Online-Service Kostenloser Online-OCR

    Um mit der Erkennung fortzufahren, klicken Sie auf "Konvertieren".

  4. Klicken Sie am Ende der Verarbeitung des Dokuments auf den Link namens der Ausgabedatei in der entsprechenden Spalte.

    Herunterladen der fertigen docx-Datei vom kostenlosen Online-OCR-Onlinedienst

    Das Ergebnis der Erkennung wird sofort in Ihrem Computerspeicher gespeichert.

Bei Bedarf kann Text aus einem kleinen PDF-Dokument entfernen, um auf die Verwendung des oben beschriebenen Werkzeugs sicher zu sein. Um mit voluminösen Dateien zu arbeiten, müssen Sie zusätzliche Charaktere in einem kostenlosen Online-OCR kaufen oder auf eine andere Lösung zurückgreifen.

Methode 3: Newroc

Vollständiger OCR-Dienst, mit dem Sie Text von fast allen grafischen und elektronischen Dokumenten wie DJVU und PDF extrahieren können. Die Ressource verhängt keine Einschränkungen der Größe und der Anzahl der erkennbaren Dateien, erfordert keine Registrierung und bietet ein breites Spektrum an verwandten Funktionen.

NewcR unterstützt 106 Sprachen und können sogar mit niedrig hoher Qualitäts-Scans von Dokumenten korrekt verarbeiten. Es ist möglich, den Texterkennungsbereich manuell auf der Dateiseite auszuwählen.

Online-Service Newocr.

  1. So können Sie sofort mit einer Ressource mit einer Ressource beginnen, ohne dass zusätzliche Aktionen ausgeführt werden müssen.

    Laden der PDF-Datei, um den Online-Service neu zu erkennen

    Direkt auf der Hauptseite befindet sich ein Formular zum Import eines Dokuments auf den Standort. Um die Datei in Neucr in Newoc herunterzuladen, verwenden Sie die Schaltfläche "Datei select" im Abschnitt IHRE FILE-Sektion auswählen. Geben Sie dann im Feld "Erkennungssprache" ein oder mehrere Quellbelagssprachen an, und klicken Sie dann auf "Upload + OCR".

  2. Geben Sie Ihre bevorzugten Erkennungseinstellungen an, wählen Sie die gewünschte Seite aus, um den Text abzurufen, und klicken Sie auf die ACR-Taste.

    Texterkennung mit PDF im Online-Service in Newoc einrichten und starten

  3. Scrollen Sie die Seite hinunter, um die Schaltfläche "Download" zu finden.

    Laden Sie in NewrocR Text auf dem Computer herunter

    Klicken Sie auf ihn und in der Dropdown-Liste, wählen Sie das gewünschte Format des Dokuments zum Herunterladen aus. Danach wird die fertige Datei mit dem extrahierten Text auf Ihren Computer heruntergeladen.

Das Werkzeug ist praktisch und erkennt ganz gut an alle Charaktere. Die Verarbeitung jeder Seite des importierten PDF-Dokuments muss jedoch unabhängig voneinander gestartet und in einer separaten Datei angezeigt werden. Sie können natürlich sofort die Erkennungsergebnisse in die Zwischenablage kopieren und mit anderen kombinieren.

Trotzdem, Angesichts der oben beschriebenen Nuance, große Texte mit neuem Extraktionsvolumen, um sehr schwierig zu extrahieren. Mit den kleinen Dateien sind der Service Copes "mit einem Knall".

Methode 4: ocr.space

Mit einer einfachen und verständlichen Ressource für die Textdämpfer können Sie PDF-Dokumente erkennen und das Ergebnis in der TXT-Datei ausgeben. In der Anzahl der Seiten sind keine Grenzen nicht angegeben. Die einzige Einschränkung ist die Größe des Eingabedokuments sollte 5 Megabyte nicht überschreiten.

Online-Service OCR.SPACE.

  1. Sie müssen sich nicht registrieren, um mit dem Werkzeug zu arbeiten.

    Importieren Sie die PDF-Datei in Online OCR.SPACE-Dienst

    Klicken Sie einfach auf den oben genannten Link und laden Sie das PDF-Dokument mit der Taste "Datei auswählen" oder vom Netzwerk mit Bezug auf das Netzwerk herunter.

  2. Wählen Sie in der Dropdown-Liste OCR-Sprache auswählen die Sprache des importierten Dokuments aus.

    Ausführen des PDF-Dokumenterkennungsprozesses im Online-Service OCR.Space

    Führen Sie dann den Texterkennungsvorgang aus, indem Sie auf die Schaltfläche "OCR beginnen" klicken.

  3. Am Ende der Dateiverarbeitung finden Sie im Ergebnis des OCR'ED-Ergebnisbereichs und klicken Sie auf "Download", um das fertige TXT-Dokument herunterzuladen.

    Herunterladen des Ergebnisses der PDF-Dateierkennung vom OCR.Space Online-Service

Wenn Sie nur Text von PDF extrahieren müssen und gleichzeitig die endgültige Formatierung, ist es überhaupt nicht wichtig, OCR.Space ist eine gute Wahl. Das einzige, das Dokument muss "Single-Sprechen" sein, da die Erkennung von zwei oder mehr Sprachen gleichzeitig im Dienst nicht angegeben ist.

Lesen Sie auch: FineReader-Kombinationsanaloga

Die Bewertung der in dem Artikel dargestellten Online-Instrumenten sollte darauf hingewiesen werden, dass der FineReader online von ABBYY am besten und qualitativ mit der OCR-Funktion ist. Wenn Sie für Sie wichtig sind, um die maximale Deformität der Texterkennung zu übernehmen, sollten Sie diese Option bestmöglich überlegen. Aber sie werden höchstwahrscheinlich für ihn bezahlen.

Wenn Sie eine Digitalisierung kleiner Dokumente benötigen, und Sie sind bereit, die Dienstfehler richtig zu korrigieren, es ist ratsam, Neucr, Ocr.Space oder kostenlose Online-OCR zu verwenden.

Weiterlesen