Jak rozpoznać plik PDF online

Anonim

Jak rozpoznać plik PDF online

Nie zawsze możesz usunąć tekst z pliku PDF za pomocą zwykłej metody kopiowania. Często strony takich dokumentów są zeskanowaną zawartość ich opcji papieru. Aby przekonwertować takie pliki do w pełni edytowalne dane tekstowe, specjalne programy są używane z funkcją rozpoznawania znaków optycznych (OCR).

Takie decyzje są bardzo złożone w sprzedaży, a zatem istnieją znaczne pieniądze. Jeśli potrzeba rozpoznawania tekstu z plikiem PDF pojawi się regularnie, będzie dość wskazany do zakupu odpowiedniego programu. W przypadku rzadkich przypadków jedna z dostępnych usług online z podobnymi funkcjami będzie bardziej logiczna.

Jak rozpoznać tekst z PDF Online

Oczywiście zestaw funkcji usług internetowych OCR, w porównaniu z pełnoprawnymi rozwiązaniami pulpitu, jest bardziej ograniczona. Ale możliwe jest pracowanie z takimi zasobami lub całkowicie wolnymi lub za opłatą symboliczną. Najważniejsze jest to, że z jego głównym zadaniem, a mianowicie, przy rozpoznawaniu tekstu, odpowiednie aplikacje internetowe również radzą.

Metoda 1: ABBYY FineReader Online

Firma deweloperska jest jednym z liderów w dziedzinie optycznego uznawania dokumentów. ABBYY FineReader for Windows i Mac to potężne rozwiązanie do konwersji PDF do tekstu i dalszej pracy z nim.

Oczywiście analogowy analogowy programu jest gorszy niż funkcjonalność. Niemniej jednak usługa może rozpoznać tekst ze skanów i fotografii w ponad 190 językach. Obsługiwane konwersja pliku PDF do Word, Dokumenty Excel itp.

Usługa online ABBYY FineReader Online

  1. Przed rozpoczęciem pracy z narzędziem utwórz konto na stronie lub zaloguj się za pomocą konta Facebooka, Google lub Microsoft.

    Rejestracja w usługach online ABBYY FineReader online

    Aby przejść do okna autoryzacji, kliknij przycisk "Zaloguj się" na panelu menu górnego.

  2. Zalogując się, zaimportuj żądany dokument PDF w FineReader, używając przycisku "Pobierz pliki".

    Rozpoznawanie tekstu z dokumentu PDF w usługach online ABBYY FineReader online

    Następnie kliknij "Wybierz numery stron" i określ żądaną szczelinę, aby rozpoznać tekst.

  3. Następnie wybierz języki obecne w dokumencie, format pliku wynikowego i kliknij przycisk "Rozpoznaj".

    Rozpoczęcie rozpoznawania tekstu z dokumentu PDF w ABBYY FineReader online

  4. Po przetworzeniu, którego czas trwania zależy wyłącznie od ilości dokumentu, można pobrać gotowy plik z danymi tekstowymi po prostu klikając na jego nazwę.

    Pobieranie gotowego dokumentu z usługi online ABBYY FineReader Online

    Eksportuj go do jednej z dostępnych usług w chmurze.

Usługa jest prawdopodobnie najdokładniejszym algorytmem rozpoznawania tekstu na obrazach i plikach PDF. Niestety, jego bezpłatne użycie jest ograniczone do pięciu przetworzonych stron miesięcznie. Aby pracować z bardziej obszernymi dokumentami, będziesz musiał kupić roczną subskrypcję.

Jeśli jednak funkcja OCR jest potrzebna dość rzadko, ABBYY FineReader Online jest doskonałą opcją wyodrębnienia tekstu z małych plików PDF.

Metoda 2: Darmowe OCR online

Prosty i wygodny tekst digitalizacji tekstu. Bez konieczności rejestracji zasób umożliwia rozpoznanie 15 pełnych stron PDF na godzinę. Darmowe OCR online w pełni współpracuje z dokumentami w 46 językach i bez autoryzacji obsługuje trzy eksport tekstowy - DOCX, XLSX i TXT.

Podczas rejestracji użytkownik ma możliwość przetwarzania dokumentów wielostronicowych, jednak bezpłatna liczba tych stron jest ograniczona do 50 jednostek.

Usługa online Darmowe OCR online

  1. Aby rozpoznać tekst z PDF jako "gościnny", bez autoryzacji na zasobach, użyj odpowiedniej formy na stronie głównej strony.

    Rozpoznawanie PDF w Internecie Darmowe OCR online

    Wybierz żądany dokument za pomocą przycisku Plik, określić główny język tekstu, format wyjściowy, poczekaj, aż plik do pobrania i kliknij Konwertuj.

  2. Na końcu procesu cyfryzacji kliknij "Pobierz plik wyjściowy", aby zapisać gotowy dokument z tekstem na komputerze.

    Ładowanie wyników rozpoznawania tekstu z plikiem PDF z bezpłatnej usługi online OCR

Dla autoryzowanych użytkowników sekwencja działań jest nieco inna.

  1. Użyj przycisku "Zarejestruj" lub "Logowanie" w panelu menu górnego, aby odpowiednio utworzyć bezpłatne konto OCR online lub przejdź do niego.

    Tworzenie konta w bezpłatnym OCR online

  2. Po autoryzacji w panelu rozpoznawania, przytrzymując klawisz "Ctrl", wybierz maksymalnie dwa języki dokumentu źródłowego z proponowanej listy.

    Definicja języków dokumentu źródłowego dla rozpoznawania tekstu w bezpłatnym OCR online

  3. Określ dalsze parametry ekstrakcji tekstu z PDF i kliknij przycisk Wybierz plik, aby pobrać dokument do usługi.

    Rozpoczęcie rozpoznawania dokumentów PDF w usługach online Darmowe OCR online

    Następnie, aby kontynuować rozpoznawanie, kliknij "Konwertuj".

  4. Pod koniec przetwarzania dokumentu kliknij link zwany plikiem wyjściowym w odpowiedniej kolumnie.

    Pobieranie gotowego pliku DOCX z bezpłatnej usługi online OCR online

    Wynik uznania natychmiast zostanie zapisany w pamięci komputera.

W razie potrzeby usuń tekst z małego dokumentu PDF może być bezpieczny do uciekania do użycia opisanego powyżej narzędzia. Aby pracować z obszernymi plikami, musisz kupić dodatkowe znaki w bezpłatnym OCR online lub ośrodku do innego rozwiązania.

Metoda 3: Newoc

W pełni darmowa usługa OCR, która umożliwia wyodrębnienie tekstu z niemal jakichkolwiek dokumentów graficznych i elektronicznych, takich jak DJVU i PDF. Zasób nie nakłada ograniczeń dotyczących rozmiaru i liczby rozpoznawalnych plików, nie wymaga rejestracji i oferuje szeroką gamę powiązanych funkcji.

Newoc obsługuje 106 języków i może poprawnie przetwarzać nawet niskie skany dokumentów. Możliwe jest ręczne wybranie obszaru rozpoznawania tekstu na stronie Plik.

Usługa online Newocr.

  1. Możesz więc natychmiast rozpocząć pracę z zasobem, bez konieczności wykonywania dodatkowych działań.

    Ładowanie pliku PDF do rozpoznawania usługi online Newoc

    Prawo na stronie głównej znajduje się formularz importowania dokumentu do witryny. Aby pobrać plik w Newocr, użyj przycisku Wybierz plik w sekcji Wybierz swój plik. Następnie w polu "Język rozpoznawania" "określa jeden lub więcej języków dokumentów źródłowych, a następnie kliknij" Prześlij + OCR ".

  2. Określ preferowane ustawienia rozpoznawania, wybierz żądaną stronę, aby pobrać tekst i kliknąć przycisk OCR.

    Konfigurowanie i uruchamianie rozpoznawania tekstu z PDF w usługach online Newoc

  3. Przewiń nieznacznie na stronie i znajdź przycisk "Pobierz".

    Pobieranie dowiedził się w newroC tekstu na komputerze

    Kliknij go i na liście rozwijanej wybierz żądany format dokumentu do pobrania. Po tym gotowy plik z wyodrębnionym tekstem zostanie pobrany do komputera.

Narzędzie jest wygodne i całkiem dobrze rozpoznaje wszystkie znaki. Jednak przetwarzanie każdej strony importowanego dokumentu PDF należy uruchomić niezależnie i jest wyświetlany w osobnym pliku. Możesz oczywiście natychmiast skopiować wyniki rozpoznawania do schowka i połącz je z innymi.

Niemniej jednak, biorąc pod uwagę wyżej opisany NUANCE, duże ilości tekstu przy użyciu Newocr do wyodrębniania bardzo trudnych. Dzięki małym plikom serwis radzi sobie "z bankiem".

Metoda 4: OCR.Space

Prosty i zrozumiały zasób dla cyfryzacji tekstowej umożliwia rozpoznanie dokumentów PDF i wyjść wynik w pliku TXT. Nie podano limitów liczby stron. Jedynym ograniczeniem jest rozmiar dokumentu wejściowego nie powinien przekraczać 5 megabajtów.

Usługa online OCR.Space.

  1. Nie musisz rejestrować się do pracy z narzędziem.

    Importuj plik PDF w usłudze OCR.Space

    Wystarczy kliknąć na link powyżej i pobierz dokument PDF do witryny z komputera za pomocą przycisku "Wybierz plik" lub z sieci przez odniesienie.

  2. W liście rozwijanej Wybierz język OCR wybierz język importowanego dokumentu.

    Uruchamianie procesu rozpoznawania dokumentów PDF w serwisie online OCR.Space

    Następnie uruchom proces rozpoznawania tekstu, klikając przycisk "Uruchom OCR!".

  3. Na końcu przetwarzania plików można znaleźć w wyniku pola wyników OCR i kliknij "Pobierz", aby pobrać gotowy dokument TXT.

    Pobieranie wyniku rozpoznawania plików PDF z usługi OCR.Space Online

Jeśli wystarczy wyodrębnić tekst z PDF, a jednocześnie ostateczne formatowanie nie jest w ogóle ważne, OCR.Space jest dobrym wyborem. Jedynym, dokument musi być "jednoczęściowy", ponieważ rozpoznawanie dwóch lub więcej języków jednocześnie w usłudze nie jest dostarczane.

Przeczytaj również: Fineader Bezpłatny analogi

Ocena instrumentów online przedstawionych w artykule należy zauważyć, że Fineader Online z ABBYY jest najbardziej dokładny i jakościowo z funkcją OCR. Jeśli jesteś ważny dla Ciebie maksymalna deformacja rozpoznawania tekstu, najlepiej jest rozważyć konkretnie tę opcję. Ale najprawdopodobniej zapłacą za niego.

Jeśli potrzebujesz digitalizacji małych dokumentów i jesteś gotowy na prawidłowe prawidłowe prawidłowe błędy serwisowe, wskazane jest użycie Newocr, OCR.Space lub bezpłatnego OCR online.

Czytaj więcej