PDF 파일을 온라인으로 인식하는 방법

일반적인 복사 방법을 사용하여 PDF 파일에서 텍스트를 항상 제거 할 수는 없습니다. 종종 그러한 문서의 페이지는 종이 옵션의 스캔 한 내용입니다. 이러한 파일을 완전히 편집 가능한 텍스트 데이터로 변환하려면 광학 문자 인식 (OCR) 기능과 함께 특수 프로그램을 사용합니다.

그러한 결정은 매출이 매우 복잡하므로 상당한 돈이 있습니다. PDF로 텍스트 인식의 필요성이 정기적으로 발생하면 해당 프로그램을 구입하는 것이 좋습니다. 드문 경우가 유사한 기능을 갖춘 온라인 서비스 중 하나가 더 논리적입니다.

PDF 온라인으로 텍스트를 인식하는 방법

물론 Full-Fledged Desktop Solutions와 비교하여 OCR 온라인 서비스의 일련의 기능은 더 제한적입니다. 그러나 그러한 자원이나 완전히 무료 또는 상징적 인 수수료를 위해 일할 수 있습니다. 주요 작업은 주요 작업으로, 즉 텍스트의 인식을 통해 해당 웹 응용 프로그램이 대처할 것입니다.

방법 1 : ABBYY FineReader 온라인

서비스 개발자 회사는 문서의 광학 인식 분야의 지도자 중 하나입니다. Windows 및 Mac 용 ABBYY FineReader는 PDF를 텍스트로 변환하고 추가 작업을위한 강력한 솔루션입니다.

물론 프로그램의 웹 아날로그는 기능에 의해 그것보다 열등합니다. 그럼에도 불구하고,이 서비스는 190 개 이상의 언어로 스캔 및 사진의 텍스트를 인식 할 수 있습니다. 지원되는 PDF 파일 변환 Word, Excel 문서 등

온라인 서비스 Abbyy FineReader 온라인

도구 작업을 시작하기 전에 사이트에서 계정을 만들거나 Facebook, Google 또는 Microsoft 계정으로 로그인하십시오.

권한 부여 창으로 이동하려면 상단 메뉴 패널에서 "로그인"버튼을 클릭하십시오.
로그인하여 "파일 다운로드"버튼을 사용하여 FineReader에서 원하는 PDF 문서를 가져옵니다.

그런 다음 "페이지 번호 선택"을 클릭하고 원하는 틈을 지정하여 텍스트를 인식하십시오.
그런 다음 문서에있는 언어, 결과 파일 형식을 선택하고 "인식"버튼을 클릭하십시오.
처리 후에는 완전히 문서의 양에 따라 다르며 이름을 클릭하면 텍스트 데이터가있는 기성품 파일을 다운로드 할 수 있습니다.

사용 가능한 클라우드 서비스 중 하나로 내보내십시오.

이 서비스는 이미지 및 PDF 파일에서 가장 정확한 텍스트 인식 알고리즘 일 것입니다. 그러나 불행히도 그 자유로운 사용은 한 달에 5 가공 된 페이지로 제한됩니다. 보다 많은 양의 보조 문서를 사용하여 연간 구독을 구입해야합니다.

그러나 OCR 기능이 매우 드물게 필요하면 ABBYY FineReader 온라인은 작은 PDF 파일에서 텍스트를 추출하는 훌륭한 옵션입니다.

방법 2 : 무료 온라인 OCR.

간단하고 편리한 텍스트 디지타이징 텍스트. 등록 할 필요없이 리소스를 사용하면 시간당 15 개의 전체 PDF 페이지를 인식 할 수 있습니다. 무료 온라인 OCR은 46 개 언어로 된 문서와 완벽하게 작동하며 권한 부여가없는 3 개의 텍스트 내보내기 - DOCX, XLSX 및 TXT를 지원합니다.

등록 할 때 사용자가 다중 페이지 문서를 처리 할 수있는 기회를 가져 오지만이 페이지의 무료 번호는 50 단위로 제한됩니다.

온라인 서비스 무료 온라인 OCR.

PDF의 텍스트를 "게스트"로 인식하려면 자원에 대한 권한 부여가 없으면 사이트의 기본 페이지에서 적절한 양식을 사용하십시오.

파일 단추를 사용하여 원하는 문서를 선택하고 텍스트의 기본 언어, 출력 형식의 주 언어를 지정한 다음 파일을 다운로드 할 때까지 기다리십시오.
디지털화 프로세스가 끝나면 "출력 파일 다운로드"를 클릭하여 완성 된 문서를 컴퓨터의 텍스트로 저장하십시오.

권한이 부여 된 사용자의 경우 작업 순서는 다소 다릅니다.

상단 메뉴 패널의 "등록"또는 "로그인"버튼을 각각 사용하고 무료 온라인 OCR 계정을 만들거나 이동하십시오.
인식 패널에서 인증 후 "Ctrl"키를 누른 상태에서 제안 된 목록에서 소스 문서의 최대 2 개 언어를 선택하십시오.
PDF에서 추가 텍스트 추출 매개 변수를 지정하고 파일 선택 단추를 클릭하여 문서를 서비스로 다운로드하십시오.

그런 다음 인정을 계속하려면 "변환"을 클릭하십시오.
문서 처리가 끝나면 해당 열의 출력 파일이라는 링크를 클릭하십시오.

인식 결과는 즉시 컴퓨터의 메모리에 저장됩니다.

필요한 경우 작은 PDF 문서에서 텍스트를 제거 할 수 있습니다. 위에서 설명한 공구 사용에 안전 할 수 있습니다. 볼륨 파일로 작업하려면 무료 온라인 OCR 또는 다른 솔루션으로의 리조트에서 추가 문자를 구입해야합니다.

방법 3 : 뉴 써버스

DJVU 및 PDF와 같은 거의 모든 그래픽 및 전자 문서에서 텍스트를 추출 할 수있는 완전 무료 OCR 서비스. 리소스는 인식 가능한 파일의 크기와 수에 대한 제한을 제한하지 않으며 등록이 필요하지 않으며 다양한 관련 기능을 제공합니다.

Now-incuunt는 106 개 언어를 지원하며 낮은 품질의 문서 스캔을 올바르게 처리 할 수 있습니다. 파일 페이지에서 텍스트 인식 영역을 수동으로 선택할 수 있습니다.

온라인 서비스 뉴 관련

따라서 추가 작업을 수행 할 필요없이 즉시 자원 작업을 시작할 수 있습니다.

메인 페이지에서 문서를 사이트로 가져 오는 양식이 있습니다. Bengoc에서 파일을 다운로드하려면 파일 선택 섹션에서 파일 선택 단추를 사용하십시오. 그런 다음 "인식 언어"필드에 하나 이상의 소스 문서 언어를 지정한 다음 "업로드 + OCR"을 클릭하십시오.
원하는 인식 설정을 지정하고 원하는 페이지를 선택하여 텍스트를 검색하고 OCR 버튼을 클릭하십시오.
페이지를 약간 더 낮추고 "다운로드"버튼을 찾으십시오.

그것을 클릭하고 드롭 다운 목록에서 문서의 원하는 형식을 선택하여 다운로드 할 문서를 선택하십시오. 그런 다음 추출 된 텍스트가있는 완성 된 파일이 컴퓨터에 다운로드됩니다.

이 도구는 편리하고 모든 문자를 잘 알고 있습니다. 그러나 가져온 PDF 문서의 각 페이지의 처리는 독립적으로 시작되어야하며 별도의 파일에 표시됩니다. 물론 즉시 인식 결과를 클립 보드에 복사하고 다른 사람들과 결합 할 수 있습니다.

그럼에도 불구하고, 전술 한 뉘앙스, 뉴욕의 큰 양의 텍스트를 사용하여 매우 어렵게 추출한다. 작은 파일을 사용하면 서비스가 "Bang으로"copes "합니다.

방법 4 : ocr.space.

텍스트 디지털화를위한 간단하고 이해할 수있는 리소스를 사용하면 PDF 문서를 인식하고 TXT 파일의 결과를 출력 할 수 있습니다. 페이지 수에는 제한 없음이 제공되지 않습니다. 유일한 제한 사항은 입력 문서의 크기가 5MB를 초과해서는 안된다는 것입니다.

온라인 서비스 ocr.space.

도구를 사용하여 작업하려면 등록 할 필요가 없습니다.

위의 링크를 클릭하고 "파일 선택"버튼을 사용하여 컴퓨터에서 PDF 문서를 다운로드하거나 네트워크에서 참조로 네트워크에서 다운로드하십시오.
OCR 언어 선택 드롭 다운 목록에서 가져온 문서의 언어를 선택하십시오.

그런 다음 "시작 OCR!"버튼을 클릭하여 텍스트 인식 프로세스를 실행하십시오.
파일 처리가 끝나면 OCR의 결과 필드의 결과를 참조하고 "다운로드"를 클릭하여 완성 된 TXT 문서를 다운로드하십시오.

PDF에서 텍스트를 추출 해야하는 경우 동시에 최종 서식이 전혀 중요하지 않아야합니다. OCR.SPACE는 좋은 선택입니다. 서비스에서 동시에 두 개 이상의 언어를 인정하지 않기 때문에 문서가 "단일 말하기"되어야합니다.

읽기 : FineReader 무료 아날로그

ABBYY에서 온라인으로 온라인으로 제시된 온라인 악기를 평가하는 것은 OCR 기능으로 가장 정확하고 질적으로 정체적으로 이루어지는 것을 알아야합니다. 텍스트 인식의 최대 기관을 중요시하는 경우이 옵션을 특별히 고려하는 것이 가장 좋습니다. 그러나 그들은 대부분 그를 위해 지불 할 것입니다.

소규모 문서의 디지털화가 필요한 경우 서비스 오류를 올바르게 해결할 준비가되면 NewCR, OCR.Space 또는 Free Online OCR을 사용하는 것이 좋습니다.