Come riconoscere il file PDF online

Anonim

Come riconoscere il file PDF online

Non è sempre possibile rimuovere il testo dal file PDF utilizzando il consueto metodo di copia. Spesso, le pagine di tali documenti sono i contenuti scansionati delle loro opzioni di carta. Per convertire tali file in dati di testo completamente modificabili, vengono utilizzati programmi speciali con la funzione di riconoscimento del carattere ottico (OCR).

Tali decisioni sono molto complesse nelle vendite e, quindi, ci sono notevoli denaro. Se la necessità di riconoscimento del testo con PDF si presenta regolarmente, sarà abbastanza consigliabile acquistare il programma appropriato. Per i casi rari, uno dei servizi online disponibili con caratteristiche simili sarà più logica.

Come riconoscere il testo con PDF online

Naturalmente, una serie di funzionalità dei servizi online OCR, rispetto alle soluzioni desktop a full-Fleedged, è più limitata. Ma è possibile lavorare con tali risorse o completamente gratuitamente o per una tassa simbolica. La cosa principale è che con il suo compito principale, vale a dire, con il riconoscimento del testo, anche le corrispondenti applicazioni web affronteranno.

Metodo 1: ABBYY FINERERER ONLINE

La società di sviluppatori di servizi è uno dei leader nel campo del riconoscimento ottico dei documenti. ABBYY FineReader per Windows e Mac è una soluzione potente per convertire il PDF in testo e lavorare ulteriormente con esso.

Il web analogico del programma, ovviamente, è inferiore ad esso per funzionalità. Tuttavia, il servizio può riconoscere il testo da scansioni e fotografie in oltre 190 lingue. Conversione del file PDF supportato a Word, documenti Excel, ecc.

Servizio online ABBYY FineReader online

  1. Prima di iniziare a lavorare con uno strumento, creare un account sul sito o accedere con l'account Facebook, Google o Microsoft.

    Registrazione nel servizio online ABBYY FineReader online

    Per andare alla finestra di autorizzazione, fare clic sul pulsante "Accedi" nel pannello MENU TOP.

  2. Accesso, importa il documento PDF desiderato in FineReader, utilizzando il pulsante "Download files".

    Riconoscimento del testo dal documento PDF nel servizio online ABBYY FineReader online

    Quindi fare clic su "Seleziona numeri di pagina" e specificare il divario desiderato per riconoscere il testo.

  3. Successivamente, selezionare le lingue presenti nel documento, il formato del file di risultato e fai clic sul pulsante "riconosci".

    Inizio del riconoscimento del testo dal documento PDF in Abbyy FineReader online

  4. Dopo l'elaborazione, la cui durata dipende interamente dalla quantità di documento, è possibile scaricare un file pronto con i dati del testo semplicemente facendo clic sul suo nome.

    Download di un documento finito dal servizio online ABBYY FineReader online

    O esportarlo in uno dei servizi cloud disponibili.

Il servizio è probabilmente gli algoritmi di riconoscimento del testo più accurati su immagini e file PDF. Ma, sfortunatamente, il suo uso gratuito è limitato alle pagine di cinque elaborate al mese. Per lavorare con documenti più voluminosi, dovrai acquistare un abbonamento annuale.

Tuttavia, se la funzione OCR è necessaria abbastanza raramente, Abbyy FineReader Online è un'opzione eccellente per estrarre il testo da piccoli file PDF.

Metodo 2: OCR online gratuito

Testo semplice e conveniente testo digitalizzante. Senza la necessità di registrarsi, la risorsa consente di riconoscere 15 pagine PDF complete all'ora. OCR online gratuito funziona completamente con documenti in 46 lingue e senza autorizzazione supporta tre esportazioni di testo - DOCX, XLSX e TXT.

Durante la registrazione, l'utente ottiene l'opportunità di elaborare i documenti multi-page, tuttavia, il numero gratuito di queste pagine è limitato a 50 unità.

Servizio online OCR gratuito online

  1. Per riconoscere il testo dal PDF come "Guest", senza autorizzazione sulla risorsa, utilizzare il modulo appropriato sulla pagina principale del sito.

    Riconoscimento PDF in OCR online gratuito online

    Selezionare il documento desiderato utilizzando il pulsante File, specificare la lingua principale del testo, il formato di output, quindi attendere il download del file e fare clic su Converti.

  2. Alla fine del processo di digitalizzazione, fare clic su "Scarica file di output" per salvare il documento finito con il testo sul computer.

    Caricamento dei risultati del riconoscimento del testo con PDF dal servizio online OCR online gratuito

Per gli utenti autorizzati, la sequenza di azioni è in qualche modo diversa.

  1. Utilizzare il pulsante "Registrati" o "Login" nel pannello MENU TOP in, rispettivamente, creare un account OCR online gratuito o andare ad esso.

    Creare un account in OCR online gratuito online

  2. Dopo l'autorizzazione nel pannello di riconoscimento, tenendo premuto il tasto "Ctrl", selezionare fino a due lingue del documento di origine dall'elenco proposto.

    Definizione delle lingue del documento di origine per il riconoscimento del testo in OCR online gratuito

  3. Specificare ulteriori parametri di estrazione del testo da PDF e fare clic sul pulsante Seleziona file per scaricare il documento sul servizio.

    Inizio del riconoscimento dei documenti PDF in servizio online OCR online gratuito

    Quindi, per procedere con il riconoscimento, fai clic su "Converti".

  4. Alla fine del trattamento del documento, fare clic sul collegamento chiamato il file di output nella colonna appropriata.

    Download del file DOCX finito dal servizio online OCR online gratuito

    Il risultato del riconoscimento verrà immediatamente salvato nella memoria del tuo computer.

Se necessario, rimuovere il testo da un piccolo documento PDF può essere sicuro per ricorrere all'uso dello strumento sopra descritto. Per lavorare con file voluminosi, dovrai acquistare caratteri aggiuntivi in ​​OCR online gratuito o ricorrere a un'altra soluzione.

Metodo 3: Newoc

Servizio OCR completamente gratuito che consente di estrarre il testo da quasi tutti i documenti grafici ed elettronici come DJVU e PDF. La risorsa non impone restrizioni sulla dimensione e il numero di file riconoscibili, non richiede la registrazione e offre una vasta gamma di funzioni correlate.

Newocock supporta 106 lingue e può elaborare correttamente le scansioni di documenti di bassa qualità. È possibile scegliere manualmente l'area di riconoscimento del testo nella pagina dei file.

Servizio online Newocr.

  1. Quindi, è possibile iniziare a lavorare con una risorsa immediatamente, senza la necessità di eseguire azioni extra.

    Caricamento del file PDF per riconoscere il servizio online Newoc

    Proprio sulla pagina principale c'è un modulo per l'importazione di un documento sul sito. Per scaricare il file in Newoc, utilizzare il pulsante Seleziona file nella sezione Seleziona il file. Quindi nel campo "Linguaggio del riconoscimento" ", specificare una o più lingue di documenti di origine, quindi fare clic su" Carica + OCR ".

  2. Specificare le impostazioni di riconoscimento preferite, selezionare la pagina desiderata per recuperare il testo e fare clic sul pulsante OCR.

    Impostazione e avvio del riconoscimento del testo con PDF nel servizio online Newoc

  3. Scorri verso il basso la pagina leggermente inferiore e trova il pulsante "Download".

    Scarica appreso nel testo di Newoc su computer

    Fare clic su di esso e nell'elenco a discesa, selezionare il formato desiderato del documento da scaricare. Successivamente, il file finito con il testo estratto verrà scaricato sul tuo computer.

Lo strumento è conveniente e abbastanza bene riconosce tutti i personaggi. Tuttavia, l'elaborazione di ciascuna pagina del documento PDF importato deve essere avviata in modo indipendente e viene visualizzato in un file separato. Puoi, naturalmente, copiare immediatamente i risultati del riconoscimento negli Appunti e combinarli con gli altri.

Ciononostante, data la sfumatura sopra descritta, grandi volumi di testo usando NewoR per estrarre molto difficile. Con i file piccoli, il servizio copi "con un botto."

Metodo 4: ocr.space

Una risorsa semplice e comprensibile per la digitalizzazione del testo consente di riconoscere i documenti PDF e in uscita il risultato nel file TXT. Non sono forniti limiti nel numero di pagine. L'unica limitazione è la dimensione del documento di input non deve superare i 5 megabyte.

Servizio online OCR.Space.

  1. Non è necessario registrarsi per funzionare con lo strumento.

    Importa file PDF nel servizio OCR.Space online

    Basta fare clic sul collegamento sopra e scaricare il documento PDF sul sito dal computer utilizzando il pulsante "Seleziona file" o dalla rete con riferimento.

  2. Nell'elenco a discesa Seleziona linguaggio OCR, selezionare la lingua del documento importato.

    Esecuzione del processo di riconoscimento del documento PDF nel servizio OCR.SPACE

    Quindi eseguire il processo di riconoscimento del testo facendo clic sul pulsante "Avvia OCR!".

  3. Alla fine del trattamento dei file, consultare il risultato nel campo dei risultati OCR'ed e fare clic su "Download" per scaricare il documento TXT finito.

    Download del risultato del riconoscimento del file PDF dal servizio online OCR.Space

Se hai solo bisogno di estrarre il testo da PDF e allo stesso tempo la formattazione finale non è affatto importante, ocr.space è una buona scelta. L'unico, il documento deve essere "singolo-lingua", poiché il riconoscimento di due o più lingue contemporaneamente nel servizio non è fornito.

Leggi anche: FineReader Analoghi gratuiti

Valutare gli strumenti online presentati nell'articolo si dovrebbe notare che il FineReader online da Abbyy è più accurato e qualitativamente con la funzione OCR. Se sei importante per te la massima deformità del riconoscimento del testo, è meglio considerare specificamente questa opzione. Ma molto probabilmente pagheranno per lui.

Se è necessaria la digitalizzazione di piccoli documenti e sei pronto per correggere correttamente gli errori di servizio, è consigliabile utilizzare Newoc, OCR.Space o OCR online gratuito.

Leggi di più