Sådan genkender du PDF-fil online

Anonim

Sådan genkender du PDF-fil online

Du kan ikke altid fjerne teksten fra PDF-filen ved hjælp af den sædvanlige kopimetode. Ofte er siderne i sådanne dokumenter det scannede indhold af deres papirindstillinger. For at konvertere sådanne filer til fuldt redigerbare tekstdata bruges specielle programmer med funktionen Optical Character Recognition (OCR).

Sådanne beslutninger er meget komplekse i salget, og derfor er der betydelige penge. Hvis behovet for tekstgenkendelse med PDF, du opstår regelmæssigt, vil det være ganske tilrådeligt at købe det relevante program. I sjældne tilfælde vil en af ​​de tilgængelige online-tjenester med lignende funktioner være mere logiske.

Sådan genkender du tekst med PDF Online

Selvfølgelig er et sæt funktioner i OCR online-tjenester sammenlignet med fuldfledet desktop-løsninger, mere begrænset. Men det er muligt at arbejde med sådanne ressourcer eller helt gratis eller for et symbolsk gebyr. Det vigtigste er, at med sin hovedopgave, nemlig med anerkendelsen af ​​teksten, vil de tilsvarende webapplikationer også klare.

Metode 1: ABBYY FineReader Online

Servicevirksomheden er en af ​​lederne inden for optisk anerkendelse af dokumenter. ABBYY FineReader til Windows og Mac er en stærk løsning til konvertering af PDF til tekst og videre med det.

Webanalogen af ​​programmet er selvfølgelig ringere end det ved funktionalitet. Ikke desto mindre kan tjenesten genkende teksten fra scanninger og fotografier på mere end 190 sprog. Understøttet PDF-filkonvertering til Word, Excel-dokumenter mv.

Online Service Abbyy FineReader Online

  1. Før du begynder at arbejde med et værktøj, skal du oprette en konto på webstedet eller logge ind med Facebook, Google eller Microsoft-kontoen.

    Registrering i onlinetjenesten ABBYY FineReader Online

    For at gå til vinduet Autorisation skal du klikke på knappen "Login" i øverste menupunkt.

  2. Ved at logge ind, importer det ønskede PDF-dokument i FineReader, ved hjælp af knappen "Download Files".

    Tekstgenkendelse fra PDF-dokumentet i onlinetjenesten ABBYY FineReader Online

    Klik derefter på "Vælg sidetal" og angiv det ønskede gap for at genkende tekst.

  3. Vælg derefter de sprog, der findes i dokumentet, resultatet filformat og klik på knappen "Accend".

    Start af tekstgenkendelse fra PDF-dokument i ABBYY FineReader Online

  4. Efter behandling, hvis varighed afhænger helt af mængden af ​​dokument, kan du downloade en færdigfremstillet fil med tekstdata ved blot at klikke på navnet.

    Downloadning af et færdigt dokument fra onlinetjenesten ABBYY FineReader Online

    Enten eksportere det til en af ​​de tilgængelige cloud-tjenester.

Tjenesten er sandsynligvis de mest nøjagtige tekstgenkendelsesalgoritmer på billeder og PDF-filer. Men desværre er dets gratis brug begrænset til fem-forarbejdede sider om måneden. For at arbejde med mere voluminøse dokumenter skal du købe et årligt abonnement.

Men hvis OCR-funktionen er nødvendig helt sjældent, er ABBYY FineReader Online en glimrende mulighed for at udtrække tekst fra små PDF-filer.

Metode 2: Gratis Online OCR

Enkel og bekvem tekstdigitalisering af tekst. Uden behovet for at registrere, giver ressourcen dig mulighed for at genkende 15 fulde PDF-sider pr. Time. Gratis online OCR arbejder fuldt ud med dokumenter på 46 sprog og uden tilladelse understøtter tre teksteksport - DOCX, XLSX og TXT.

Ved registrering får brugeren mulighed for at behandle multi-sidedokumenter, men det gratis nummer på disse sider er begrænset til 50 enheder.

Online Service Gratis Online OCR

  1. For at genkende tekst fra PDF som en "gæst", uden tilladelse på ressourcen, skal du bruge den relevante formular på webstedets hovedside.

    PDF-anerkendelse i online gratis online OCR

    Vælg det ønskede dokument ved hjælp af filnappen, angiv hovedsproget i teksten, outputformatet, og vent derefter på, at filen downloader, og klik på Konverter.

  2. I slutningen af ​​digitaliseringsprocessen skal du klikke på "Download Output File" for at gemme det færdige dokument med teksten på computeren.

    Indlæsning af tekstgenkendelsesresultater med PDF fra gratis online OCR Online Service

For de autoriserede brugere er sekvensen af ​​handlinger noget anderledes.

  1. Brug knappen "Registrer" eller "Login" i det øverste menupunkt til henholdsvis, opret en gratis online OCR-konto eller gå til det.

    Oprettelse af en konto i online gratis online OCR

  2. Efter godkendelse i genkendelsespanelet skal du vælge "CTRL" -tasten, vælge op til to sprog i kildedokumentet fra den foreslåede liste.

    Definition af sprogene i kildedokumentet for tekstgenkendelse i gratis online OCR

  3. Angiv yderligere tekstudvindingsparametre fra PDF, og klik på knappen Vælg fil for at downloade dokumentet til tjenesten.

    Start af PDF-dokumentgenkendelse i onlinetjenesten Gratis Online OCR

    Hvis du vil fortsætte med genkendelse, skal du klikke på "Konverter".

  4. Ved afslutningen af ​​behandlingen af ​​dokumentet skal du klikke på linket kaldet outputfilen i den relevante kolonne.

    Downloadning af den færdige DOCX-fil fra den gratis online OCR Online Service

    Resultatet af anerkendelse vil straks blive gemt i din computers hukommelse.

Hvis det er nødvendigt, skal du fjerne tekst fra et lille PDF-dokument kan være sikkert at ty til brugen af ​​værktøjet beskrevet ovenfor. For at arbejde med voluminøse filer skal du købe yderligere tegn i gratis online OCR eller udvej til en anden løsning.

Metode 3: NewOrst

Fuldt gratis OCR-tjeneste, der giver dig mulighed for at udtrække tekst fra næsten alle grafiske og elektroniske dokumenter som DJVU og PDF. Ressourcen pålægger ikke begrænsninger på størrelsen og antallet af genkendelige filer, kræver ikke registrering og tilbyder en bred vifte af relaterede funktioner.

Newocr understøtter 106 sprog og kan korrekt behandle selv lavkvalitets scanninger af dokumenter. Det er muligt at manuelt vælge tekstgenkendelsesområdet på filsiden.

Online Service Newocr.

  1. Så du kan begynde at arbejde med en ressource straks, uden at skulle udføre ekstra handlinger.

    Indlæser PDF-filen for at genkende online service newocr

    Lige på hovedsiden er der en formular til at importere et dokument til webstedet. For at downloade filen i NewOrk skal du bruge knappen Vælg fil i afsnittet Vælg din fil. Så i feltet "Recognition Sprog (s)" angive et eller flere kilde dokumentsprog, og derefter klikke på "Upload + OCR".

  2. Angiv dine foretrukne genkendelsesindstillinger, vælg den ønskede side for at hente teksten og klikke på OCR-knappen.

    Opsætning og lancering af tekstgenkendelse med PDF i Online Service NewOrn

  3. Rul ned på siden Lidt ned, og find knappen "Download".

    Download lært i NewOrs Text on Computer

    Klik på den og i rullelisten, vælg det ønskede format for dokumentet, der skal downloades. Derefter downloades den færdige fil med den udpakkede tekst til din computer.

Værktøjet er praktisk og anerkender ganske godt alle tegn. Behandlingen af ​​hver side af det importerede PDF-dokument skal dog lanceres uafhængigt og vises i en separat fil. Du kan selvfølgelig straks kopiere indregningen resulterer i udklipsholderen og kombinere dem med andre.

Ikke desto mindre i betragtning af den ovenfor beskrevne nuance, store mængder tekst, der bruger NewOrs til at udtrække meget vanskelig. Med de små filer, tjenesten coper "med et bang."

Metode 4: OCR.Space

En simpel og forståelig ressource til tekstdigitalisering giver dig mulighed for at genkende PDF-dokumenter og udsende resultatet i TXT-filen. Ingen grænser i antallet af sider er ikke angivet. Den eneste begrænsning er størrelsen af ​​indgangsdokumentet, må ikke overstige 5 megabyte.

Online Service OCR.Space.

  1. Du behøver ikke at registrere dig for at arbejde med værktøjet.

    Import PDF-fil i online OCR.Space Service

    Bare klik på linket ovenfor og download PDF-dokumentet til webstedet fra computeren ved hjælp af knappen "Vælg fil" eller fra netværket med reference.

  2. I rullemenuen Vælg OCR-sprog skal du vælge sproget for det importerede dokument.

    Kørsel af PDF-dokumentgenkendelse processen i onlinetjenesten OCR.Space

    Kør derefter tekstregenkendelsesprocessen ved at klikke på knappen "Start OCR!".

  3. I slutningen af ​​filbehandlingen, se resultatet i OCR'ed resultatfeltet og klik på "Download" for at downloade det færdige TXT-dokument.

    Downloading af resultatet af PDF-filgenkendelse fra OCR.Space Online Service

Hvis du bare skal udtrække tekst fra PDF, og samtidig er den endelige formatering, er det slet ikke vigtigt, OCR.Space er et godt valg. Den eneste, dokumentet skal være "single-talende", da anerkendelsen af ​​to eller flere sprog samtidigt i tjenesten ikke leveres.

Læs også: FineReader gratis analoger

Evaluering af de onlineinstrumenter, der præsenteres i artiklen, skal bemærkes, at FineReader online fra ABBYY er mest præcise og kvalitativt med OCR-funktionen. Hvis du er vigtig for dig den maksimale deformitet af tekstregenkendelsen, er det bedst at overveje specifikt denne mulighed. Men de vil højst sandsynligt betale for ham.

Hvis du har brug for digitalisering af små dokumenter, og du er klar til korrekt korrekte servicefejl, er det tilrådeligt at bruge NewOrn, OCR.Space eller gratis online OCR.

Læs mere