Ostatnio możesz coraz częściej spotykać sytuację, w której musisz przetłumaczyć dowolny tekst zawarty w obrazach w elektronicznej formie tekstowej. Aby zaoszczędzić czas, a nie przedrukować ręcznie, należy użyć specjalnych aplikacji komputerowych do rozpoznawania tekstu, które powiemy dzisiaj.
Jak digitalizować tekst
Istnieje wiele aplikacji do zastosowań digitalizacji tekstu na rynku, więc każdy użytkownik znajdzie rozwiązanie, które spełnia wymagania.Metoda 1: ABBYY FineReader
Ta uwarunkowana aplikacja z rosyjskiego dewelopera ma ogromną funkcjonalność i pozwala nie tylko rozpoznać tekst, ale także edytować go, zaoszczędzić w różnych formatach i skanujących źródłach papieru.
- Aby rozpoznać tekst na zdjęciu, przede wszystkim, musisz go przesłać do programu. Aby to zrobić, po uruchomieniu ABBYY FineReader kliknij przycisk "Otwórz w przycisk Edytora OCR".
Po tej działaniu okno wyboru źródła otwiera się, gdzie musisz znaleźć i otworzyć żądany obraz. Obsługiwane są następujące popularne formaty: JPEG, PNG, GIF, TIFF, XPS, BMP itp., A także plików PDF i DJVU.
- Po pobraniu w ABBYY FineReader rozpoznawanie tekstu jest automatycznie zaczyna się na obrazku bez interwencji.
Jeśli chcesz powtórzyć procedurę rozpoznawania, wystarczy nacisnąć przycisk "Rozpoznawaj" w górnym menu.
- Czasami nie wszystkie programy symboli mogą poprawnie rozpoznać. Może to być, jeśli obraz na źródle nie jest zbyt wysokiej jakości, bardzo małą czcionką, istnieje kilka różnych języków w tekście, używane są znaki niestandardowe. Ale nie ma znaczenia, ponieważ błędy można poprawić ręcznie, za pomocą edytora tekstu i zestaw narzędzi, które są zawarte w nim.
Aby ułatwić wyszukiwanie nieścisłości digitalizacji, domyślny program przydziela możliwe błędy z turkusowym kolorem.
- Logicznym końcem procesu rozpoznawania jest zachowanie jego wyników. Aby to zrobić, kliknij przycisk "Zapisz" na panelu menu górnego. Domyślnie ma widok na ikony Starego logo Microsoft Word. Przed nami pojawia się okno, gdzie można samodzielnie określić przyszłą lokalizację, w której zostanie umieszczony plik z rozpoznanym tekstem, a także jego format. Dostępne są następujące opcje dotyczące oszczędzania: Doc, DocX, RTF, PDF, Odt, HTML, TXT, XLS, XLSX, PPTX, CSV, FB2, EPUB, DJVU.
ABBYY FineReader jest najbardziej zaawansowanym rozwiązaniem, ale jest jednoznacznie zalecany, że uniemożliwia płatnym modelem dystrybucji i ograniczenia wersji próbnej.
Metoda 2: Readiris
Aplikacja Readiris wzmocniła na rynku jako najbliższy zawodnikowi jeźdźca, o którym wspomniano powyżej - zapewnia taką funkcjonalność, niektóre aspekty wykonują trochę lepsze niż produkty ABBYY.
- Po uruchomieniu aplikacji wybierz źródło danych dla digitalizacji - ze skanera lub z gotowego pliku graficznego.
W przykładzie użyjemy ostatniej opcji - dla niego użyj przycisku "z pliku".
- Otworzy się okno dialogowe "Eksplorator", w którym należy wybrać niezbędne dokumenty. Większość formatów graficznych jest obsługiwana, a także PDF.
- Poczekaj, aż dokument zostanie załadowany do programu, po czym należy skonfigurować rozpoznawanie tekstu. Przede wszystkim musisz zainstalować główny język - wybierz go z menu rozwijanego.
Polecamy również zauważając opcję "Analiza tekstu", dzięki czemu jakość cyfryzacji jest znacznie poprawiona.
- Następnie odnoszą się do menu "Narzędzia" - parametry dostępne w nim pomogą rozwiązać pewne problemy ze skanowaniem, takie jak zniekształcenia perspektywiczne, niewystarczające kontrast obrazu lub przemieszczenia tekstu w stosunku do płótnia.
Z tego menu można również poprawić tekst, jeśli rozpoznawanie działało nieprawidłowo.
- Po wprowadzeniu zmian w rozpoznanym tekście ustaw format wyjściowy odebranych danych za pomocą menu tej samej nazwy na pasku narzędzi. Główne formaty są uważane za PDF, a także pliki Microsoft Office (DocX i XLSX) - kliknij żądaną pozycję, aby wybrać.
Wszystkie możliwe formaty eksportu są pogrupowane w "Inny" akapit. Oprócz typów typów plików wymienionych powyżej, cyfrowy tekst można zapisać jako dane OpenOffice, pliki hipertekstowe lub zwykły txt.
- Po wybraniu formatu otwiera się okno Kreator eksportu. W nim można skonfigurować jeden lub inne parametry odebranego pliku (zależą od wybranego formatu) i opcję Zapisz (lokalna lub w serwisie w chmurze). Po dokonaniu wszystkich wymaganych zmian kliknij OK.
Pojawi się ponownie okno "Eksplorator", w którym należy wybrać żądany katalog oszczędzania miejsca docelowego.
Ogólnie rzecz biorąc, Readiris jest wygodnym i nowoczesnym rozwiązaniem dla tekstu digitalizacji, jednak płatny model dystrybucji można nazwać znaczącą wadą.
Metoda 3: Ridoc
Inną aplikacją koncentrowaną na skanerach może jednak pracować z lokalnymi plikami w różnych formatach.
- Otwórz aplikację. Aby rozpocząć, użyj przycisku "Otwórz" lub "Skaner" na pasku narzędzi - pierwszy jest odpowiedzialny za rozpoznawanie tekstu w plikach lokalnych, druga umożliwia rozpoczęcie digitalizacji jednocześnie ze skanowaniem. Na przykład użyjemy pierwszej opcji.
- W oknie "Eksplorator" przejdź do dokumentu, z którego chcesz uzyskać tekst i wybrać go. Dostępne jest również przetwarzanie wsadowe dokumentów.
- W razie potrzeby możesz obsługiwać wynikowy plik: Przytnij zdjęcie, ustaw obszar rozpoznawania, naprawić wady skanowania.
Oddzielnym elementem jest możliwość klejenia - w tym przypadku dokument multistagon zostanie zapisany przez pojedynczy plik. Możesz wybrać wartość DPI i format wyjściowy (dostępne są tylko pliki obrazów).
- Rozpoznawać tekst po prawej stronie okna, znajdź zakładkę OCR i otwórz go. Nie ma wielu dostępnych opcji - możesz wybrać tylko język dokumentu. Po zmianie pakietu kliknij przycisk "Rozpoznaj" na pasku narzędzi.
Stąd można również dostosować wyniki cyfryzacji.
- Zapisywanie dokumentów dostępnych w dwóch opcjach - bezpośrednio lub eksport do aplikacji biurowych. Aby wykonać pierwszą metodę, użyj przycisku "Zapisz". Okno zostanie otwarte, w którym można wybrać lokalizację zapisu, a także typu (pojedyncze pliki lub jeden multiplocked). Format zapisanego pliku zależy od klejenia wybranego na scenie.
Wyniki eksportowe są możliwe w procesorach tekstowych pakietów Microsoft lub OpenOffice Pakiety, jako e-mail (przycisk poczty), w formacie PDF lub drukowaniu na drukarce. Do eksportu do programów biurowych muszą być instalowane na komputerze, przy zachowaniu PDF jest możliwe nawet bez odpowiednich aplikacji.
Jak widzimy, zagadka jest silną decyzją, ale dla prostych wariantów, digitalizacja jest dość odpowiednia.
Metoda 4: Capture2Text
Małe narzędzie, które pozwala rozpoznać tekst z dowolnego obszaru na ekranie komputera, całkowicie bezpłatne i łatwe w użyciu.
Pobierz Capture2Text z oficjalnej strony
- Załaduj archiwum z programem i rozpakuj go w dowolnym wygodnym miejscu. Następnie przejdź do uzyskanego katalogu i uruchom plik wykonywalny.
Następnie otwórz zasobnik systemowy - Ikona użyteczności powinna pojawić się w nim.
Aby zmienić język rozpoznawania, kliknij prawym przyciskiem myszy ikonę Capture2Text w zasobniku systemowym, a następnie wybierz "OCR Język" w ustawieniach i ustaw żądany język.
- Otwórz plik, tekst, z którego chcesz digitalizować, na przykład, dokumentu DJVU bez warstwy tekstowej. Gdy plik jest otwarty, naciśnij kombinację klawisza WIN + q i wybierz obszar rozpoznawania.
- Okno Utility pojawi się z wyników rozpoznawania. Uzyskane dane można skopiować do dowolnej aplikacji, która obsługuje wpisując tekst użytkownika.
Aplikacja jest niezwykle prosta, ale zamienia się w ograniczoną funkcjonalność, a czasem nieprawidłowe rozpoznawanie rosyjskiego tekstu. Również dla wad możemy przypisać brak lokalizacji w rosyjski. Jednak dla niektórych użytkowników te minusy są nieznaczne, a główne możliwości będą wystarczające.
Metoda 5: Cuniform
Kolejna decyzja o digitalizacji tekstu utworzonego w przestrzeni powietrznej. Pomimo zaprzestania rozwoju jest nadal istotne.
- Podobnie jak wiele innych programów prezentowanych w tym artykule, KuneForm wie, jak pracować z gotowymi obrazami i odbierać dane bezpośrednio ze skanera. Używamy pierwszej opcji - aby to zrobić, otwórz menu "Plik" i wybierz Otwórz element.
- Poprzez "Eksplorator" wybierz żądany plik lub pliki.
- Po pobraniu danych do programu, użyj elementów "Rozpoznawanie" - "Autosmetyczne".
Pozwoli to wybrać obszary z tekstem, aby uzyskać bardziej poprawne działanie modułu OCR. Jeśli automatyczne algorytmy nieprawidłowo podano stroną, obszar tekstowy może być sterowany ręcznie lub usunięty.
- Następnie możesz zaangażować się bezpośrednio przez digitalizację. Otwórz ponownie menu "Rozpoznawanie" i wybierz opcję o tej samej nazwie.
- Uznany tekst zostanie otwarty w oknie aplikacji, gdzie można go również edytować. Funkcje są dość obszerne i odpowiadają pełnoprawnym edytorze tekstu. Jeśli na komputerze zainstalowano MS Word Słowo, otrzymane dane będą otwarte przez jego interfejs.
- Zapisywanie wyników pracy dostępnej na elementach "Plik" - "Zapisz".
W "Eksplorator" wybierz lokalizację odebranego pliku i jego format. Niewiele opcji jest obsługiwane: TXT, RTF, Wewnętrzny format Fed, a także eksport do aplikacji Microsoft Office (Word i Excel).
Jak widać, Cuniform jest prosty, a jednocześnie potężne narzędzie do digitalizacji tekstu. Zaletą wagi będzie jednak modelem dystrybucji wolnej, jednak wady w formie końca wsparcia i braku formatu PDF mogą spowodować stosowanie do alternatyw.
Wniosek
Jak widać, rozpoznać tekst z obrazu jest dość prosty, jeśli używasz specjalistycznych aplikacji. Ta procedura nie wymaga dużego wysiłku, a korzyści będą w świetnym oszczędzaniu czasu.