Como reconhecer o arquivo PDF online

Anonim

Como reconhecer o arquivo PDF online

Você nem sempre pode remover o texto do arquivo PDF usando o método de cópia usual. Muitas vezes, as páginas desses documentos são os conteúdos digitalizados de suas opções de papel. Para converter esses arquivos para dados de texto totalmente editáveis, programas especiais são usados ​​com a função de reconhecimento de caracteres ópticos (OCR).

Tais decisões são muito complexas em vendas e, portanto, há dinheiro considerável. Se a necessidade de reconhecimento de texto com PDF você surgir regularmente, será bastante aconselhável comprar o programa apropriado. Para casos raros, um dos serviços on-line disponíveis com características semelhantes será mais lógico.

Como reconhecer o texto com o PDF on-line

Claro, um conjunto de recursos do OCR Online Services, comparado com soluções de desktops com full-fledge, é mais limitada. Mas é possível trabalhar com tais recursos ou totalmente gratuitos ou por uma taxa simbólica. O principal é que, com sua tarefa principal, ou seja, com o reconhecimento do texto, os aplicativos da Web correspondentes também serão lados.

Método 1: ABBYY FineReader Online

A empresa de desenvolvedores de serviços é um dos líderes no campo do reconhecimento óptico dos documentos. ABBYY FineReader para Windows e Mac é uma solução poderosa para converter PDF para texto e trabalhar mais com ele.

O análogo da Web do programa, é claro, é inferior à funcionalidade. No entanto, o serviço pode reconhecer o texto de digitalizações e fotografias em mais de 190 idiomas. Conversão de arquivo PDF suportada para palavra, documentos do Excel, etc.

Serviço Online Abbyy FineReader Online

  1. Antes de começar a trabalhar com uma ferramenta, crie uma conta no site ou faça login com a conta do Facebook, Google ou Microsoft.

    Registro no serviço online ABBYY FineReader online

    Para ir para a janela de autorização, clique no botão "Login" no painel de menu superior.

  2. Ao efetuar login, importe o documento PDF desejado no FineReader, usando o botão "Baixar arquivos".

    Reconhecimento de texto do documento PDF no serviço on-line ABBYY FineReader on-line

    Em seguida, clique em "Selecionar números de página" e especifique a lacuna desejada para reconhecer o texto.

  3. Em seguida, selecione os idiomas presentes no documento, o formato de arquivo de resultados e clique no botão "Reconhecer".

    Início do reconhecimento de texto do documento PDF em ABBYY FineReader on-line

  4. Após o processamento, cuja duração depende inteiramente da quantidade de documento, você pode baixar um arquivo pronto com dados de texto simplesmente clicando em seu nome.

    Baixando um documento acabado a partir do serviço online ABBYY FineReader online

    Exporte-o para um dos serviços de nuvem disponíveis.

O serviço é provavelmente os algoritmos de reconhecimento de texto mais precisos em imagens e arquivos PDF. Mas, infelizmente, seu uso livre é limitado a cinco páginas processadas por mês. Para trabalhar com documentos mais volumosos, você terá que comprar uma assinatura anual.

No entanto, se a função OCR for necessária, raramente, Abbyy FineReader on-line é uma excelente opção para extrair texto de pequenos arquivos PDF.

Método 2: Oncr gratuito OCR

Texto de digitalização de texto simples e conveniente. Sem a necessidade de se registrar, o recurso permite reconhecer 15 páginas PDF completas por hora. O OCR on-line gratuito funciona totalmente com documentos em 46 idiomas e sem autorização suporta três exportações de texto - DocX, XLSX e TXT.

Ao se registrar, o usuário obtém a oportunidade de processar documentos multi-páginas, no entanto, o número livre dessas páginas é limitado a 50 unidades.

Serviço Online Online Grátis OCR

  1. Para reconhecer o texto de PDF como "convidado", sem autorização no recurso, use o formulário apropriado na página principal do site.

    Reconhecimento PDF em on-line on-line online OCR

    Selecione o documento desejado usando o botão Arquivo, especifique o idioma principal do texto, formato de saída e aguarde o arquivo para download e clique em Converter.

  2. No final do processo de digitalização, clique em "Baixar arquivo de saída" para salvar o documento finalizado com o texto no computador.

    Carregando o reconhecimento de texto Resultados com PDF a partir do serviço online online online gratuito

Para os usuários autorizados, a sequência de ações é um pouco diferente.

  1. Use o botão "Registrar" ou "Login" no painel de menu superior para, respectivamente, crie uma conta OCR on-line gratuita ou vá para ele.

    Criando uma conta em on-line on-line online OCR

  2. Após a autorização no painel de reconhecimento, mantenha a tecla "CTRL", selecione até dois idiomas do documento de origem da lista proposta.

    Definição dos idiomas do documento de origem para reconhecimento de texto em OCR on-line gratuito

  3. Especifique novos parâmetros de extração de texto de PDF e clique no botão Selecionar arquivo para baixar o documento para o serviço.

    Início do reconhecimento de documentos PDF no serviço online on-line gratuito OCR

    Em seguida, para prosseguir com o reconhecimento, clique em "Converter".

  4. No final do processamento do documento, clique no link chamado o arquivo de saída na coluna apropriada.

    Baixando o arquivo Docx concluído do serviço on-line online gratuito OCR

    O resultado do reconhecimento será imediatamente salvo na memória do seu computador.

Se necessário, remova o texto de um pequeno documento PDF pode ser seguro para recorrer ao uso da ferramenta descrita acima. Para trabalhar com arquivos volumosos, você terá que comprar caracteres adicionais em OCR on-line gratuito ou recorrer a outra solução.

Método 3: Newocr

Serviço de OCR totalmente gratuito que permite extrair texto de quase todos os documentos gráficos e eletrônicos, como DJVU e PDF. O recurso não impõe restrições ao tamanho e número de arquivos reconhecíveis, não requer registro e oferece uma ampla gama de funções relacionadas.

Newocr suporta 106 idiomas e pode processar corretamente mesmo varreduras de documentos de baixa qualidade. É possível escolher manualmente a área de reconhecimento de texto na página de arquivos.

Serviço Online Newocr.

  1. Então, você pode começar a trabalhar com um recurso imediatamente, sem a necessidade de executar ações extras.

    Carregando o arquivo PDF para reconhecer o serviço online Newocr

    Logo na página principal, há um formulário para importar um documento para o site. Para baixar o arquivo em Newocr, use o botão Selecionar arquivo na seção Selecionar sua ficha. Em seguida, no campo "RECONHECIMENTO (S)" ", especifique um ou mais idiomas de documentos de origem e, em seguida, clique em" Upload + OCR ".

  2. Especifique suas configurações de reconhecimento preferenciais, selecione a página desejada para recuperar o texto e clique no botão OCR.

    Configurando e lançando o reconhecimento de texto com o PDF no serviço online Newocr

  3. Role para baixo a página ligeiramente inferior e encontre o botão "Download".

    Download aprendido no texto Newocr no computador

    Clique nele e na lista suspensa, selecione o formato desejado do documento para baixar. Depois disso, o arquivo acabado com o texto extraído será baixado para o seu computador.

A ferramenta é conveniente e muito bem reconhece todos os caracteres. No entanto, o processamento de cada página do documento PDF importado deve ser lançado de forma independente e é exibido em um arquivo separado. Você pode, é claro, copiar imediatamente o reconhecimento resulta na área de transferência e combiná-los com os outros.

No entanto, dada a nuance acima descrita, grandes volumes de texto usando Newocr para extrair muito difícil. Com os pequenos arquivos, o serviço lidou "com um estrondo".

Método 4: OCR.Space

Um recurso simples e compreensível para digitalização de texto permite reconhecer documentos PDF e saída o resultado no arquivo TXT. Nenhum limita no número de páginas não são fornecidos. A única limitação é o tamanho do documento de entrada não deve exceder 5 megabytes.

Serviço Online OCR.SPACE.

  1. Você não precisa se registrar para trabalhar com a ferramenta.

    Importar arquivo PDF no serviço online OCR.SPACE

    Basta clicar no link acima e baixar o documento PDF para o site a partir do computador usando o botão "Selecionar arquivo" ou da rede por referência.

  2. Na lista suspensa Selecionar OCR, selecione o idioma do documento importado.

    Executando o processo de reconhecimento de documentos PDF no serviço on-line OCR.Space

    Em seguida, execute o processo de reconhecimento de texto clicando no botão "Iniciar OCR!".

  3. No final do processamento de arquivos, consulte o resultado no campo Resultado OCR e clique em "Download" para baixar o documento TXT acabado.

    Download do resultado do reconhecimento do arquivo PDF do serviço on-line OCR.SPACE

Se você precisar extrair texto de PDF e, ao mesmo tempo, a formatação final não é importante, OCR.Space é uma boa escolha. O único, o documento deve ser "de fala única", uma vez que o reconhecimento de dois ou mais idiomas simultaneamente no serviço não é fornecido.

Leia também: Análogos de cortesia do FineReader

Avaliar os instrumentos on-line apresentados no artigo deve ser observado que o FineReader on-line a partir de ABBYY é mais preciso e qualitativamente com a função OCR. Se você é importante para você, a deformidade máxima do reconhecimento de texto, é melhor considerar especificamente essa opção. Mas eles provavelmente pagarão por ele.

Se você precisar de digitalização de documentos pequenos e estiver pronto para corrigir corretamente os erros de serviço, é aconselhável usar o Newocr, OCR.Space ou OCR on-line gratuito.

Consulte Mais informação