Optyczne rozpoznawanie znaków (OCR) to termin określający oprogramowanie, które może rozpoznawać znaki tekstowe na obrazie, a oprogramowanie OCR zazwyczaj umożliwia wyodrębnienie tekstu z obrazu, co jest pierwszym krokiem do jego edycji. Każdy skaner jest zazwyczaj wyposażony we własne oprogramowanie OCR, ale korzystanie z każdego z nich to inny proces. Z kolei Microsoft OneNote jest teraz dostępny zarówno na komputerach Mac, jak i Windows, ma funkcję OCR i wyodrębniania tekstu oraz jest bezpłatnie dostępny na nowoczesnych komputerach, tabletach i smartfonach, dzięki czemu proces wyodrębniania tekstu z obrazów jest znacznie prostszy i przewidywalny. Wszystkie komputerowe i mobilne wersje programu OneNote obejmują funkcje wyodrębniania tekstu - nawet wersje bezpłatne - ale możesz wyodrębnić tekst z obrazu tylko za pomocą komputerowej wersji programu OneNote.
Kroki
Metoda 1 z 2: Wyodrębnianie zeskanowanego tekstu
Krok 1. Pobierz OneNote na komputer stacjonarny
Na komputerze Mac lub PC z systemem Windows proces będzie się nieznacznie różnić w zależności od wersji systemu operacyjnego i preferencji; możesz go pobrać z Office.com. Ogólnie rzecz biorąc, OneNote dla komputerów Mac jest bardzo podobny do OneNote dla systemu Windows; funkcjonalność OCR działa w zasadzie tak samo w obu.
Krok 2. Kliknij ikonę Zdjęcia
Ikonę można znaleźć na karcie Wstawianie programu OneNote (ikona mówi „Obraz” na komputerze Mac). Interfejs programu OneNote ma domyślnie dużą wstążkę u góry, a ikona „Obrazy” (lub „Obraz” na komputerze Mac) znajduje się na karcie Wstawianie po lewej stronie. Na Macu możesz także wybrać „Obraz” z menu „Wstaw” u góry ekranu. Po kliknięciu ikony pojawia się okno Wstaw obraz (lub okno „Wybierz obraz” na Macu).
- Jeśli nie widzisz kart lub ikon, kliknij przycisk Opcje wyświetlania wstążki po lewej stronie przycisku Minimalizuj w prawym górnym rogu okna aplikacji i wybierz opcję „Pokaż karty i polecenia”. Na Macu możesz po prostu korzystać z menu u góry ekranu, więc karty nie są potrzebne.
- Najedź kursorem myszy na przyciski, aby zobaczyć, jak się nazywają.
Krok 3. Przejdź do wybranego obrazu i wybierz go
Gdy to zrobisz, kliknij Otwórz ("Wstaw" na Macu). Plik obrazu pojawi się w programie OneNote w miejscu, w którym znajduje się kursor.
- Możesz również wybrać Plik Wydruk zamiast Obraz, aby wyodrębnić tekst z wydruku dokumentu.
- Alternatywnie naciśnij przycisk ⎙ PrtScr na klawiaturze, aby przechwycić obraz bieżącego ekranu, a następnie wklej go do dokumentu za pomocą Ctrl+V (lub ⌘ Cmd+V na komputerze Mac).
- Tekst w obrazie, z którego wyodrębniasz, musi być złożony, aby zapewnić dobre rozpoznawanie OCR.
Krok 4. Kliknij obraz prawym przyciskiem myszy i wybierz „Kopiuj tekst z obrazu
Tekst na obrazie zostanie skopiowany do schowka komputera.
W systemie Windows, jeśli zamiast obrazu wybierzesz Wydruk pliku w kroku 2, kliknięcie prawym przyciskiem myszy na jednej stronie wydruku spowoduje wyświetlenie dwóch alternatywnych opcji: „Kopiuj tekst z tej strony wydruku” lub „Kopiuj tekst ze wszystkich stron” Wydruku” – wybierz żądany
Krok 5. Wklej tekst z powrotem do OneNote za pomocą Ctrl + V (lub ⌘ Cmd + V na Macu) i edytuj go w aplikacji, jeśli chcesz.
Możesz także wkleić obraz do innego programu.
- Możesz zaznaczyć tekst za pomocą kursora myszy, a następnie naciskając Ctrl+C (lub ⌘ Cmd+C na Macu). Możesz też kliknąć tekst prawym przyciskiem myszy (lub Ctrl+kliknąć na Macu) i wybrać „Kopiuj”.
- Jeśli zapisałeś wyodrębniony tekst i uzyskujesz do niego dostęp z niekomputerowej wersji programu OneNote, instrukcje dotyczące kopiowania i wklejania będą się znacznie różnić. Na przykład w systemie Android musisz nacisnąć i przytrzymać fragment tekstu, który chcesz, użyć powstałych „uchwytów” po obu stronach, aby zaznaczyć cały tekst, i nacisnąć przycisk Kopiuj lub Wytnij (ikony mają dwie strony jedna na drugiej i nożyczkami).
Krok 6. Wklej skopiowany tekst do innej aplikacji
Microsoft Word lub Google Docs to popularne aplikacje; po prostu otwórz nowy lub istniejący dokument w tej aplikacji i naciśnij Ctrl+V (lub ⌘ Cmd+V na Macu). Tekst prawdopodobnie będzie wyglądał dość brzydko po wklejeniu.
Możesz zapisać dokument bezpośrednio przed edycją, aby móc wrócić do oryginalnego, nieedytowanego tekstu
Krok 7. Edytuj i sformatuj tekst jak zwykle
Jesteś ograniczony pod względem formatowania i to tylko przez aplikację, do której zdecydujesz się wkleić – na przykład najnowsza wersja Microsoft Word zawsze ma znacznie więcej opcji i daje znacznie większą kontrolę niż na przykład Microsoft Notatnik czy nawet Dokumenty Google.
Metoda 2 z 2: Korzystanie z innych ekstraktorów
Krok 1. Otwórz dowolny ekstraktor, którego używasz
Niezależnie od wybranego ekstraktora, proces obejmuje otwarcie obrazu w ekstraktorze, wyodrębnienie z niego tekstu, a następnie skopiowanie i wklejenie tekstu do dokumentu w celu edycji. Mnóstwo różnych rodzajów aplikacji lub usług:
- Oprogramowanie dołączone do skanera: Jeśli masz skaner i nadal masz dołączone do niego oprogramowanie, prawdopodobnie zawiera ono funkcje wyodrębniania tekstu OCR. Instrukcje powinny być dołączone do skanera lub powinieneś być w stanie wyszukać je online w celu znalezienia stosunkowo nowoczesnego skanera.
-
Darmowe strony internetowe: te oparte na reklamach, ale funkcjonalne strony internetowe zazwyczaj przyjmują formaty TIF, GIF, PDF, JPG, BMP, PNG lub inne kombinacje. Często mają ograniczenia (takie jak 5 MB) dotyczące rozmiaru plików, które możesz przesłać. Niektóre witryny prześlą Ci e-mailem dokument Word lub inny plik zawierający tekst Twojego obrazu za darmo, inne po prostu udostępnią tekst do skopiowania. Kilka z nich to:
- Free-ocr.com
- Onlineocr.net
-
Kosztowne oprogramowanie OCR: Niektóre programy OCR kosztują do 500 USD; rozważ je tylko wtedy, gdy potrzebujesz bardzo dokładnych wyników OCR. Niektóre z bardziej popularnych można znaleźć na TopTenReviews.com lub podobnych witrynach; kilka z najlepszych obecnie obejmuje:
- Omni Page Standard
- Adobe Acrobat
- ABBYY Fine Reader
-
Darmowe oprogramowanie; jest prawdopodobne, że te rozwiązania nie będą działać z większymi obrazami, a wiele z nich nie działa więcej niż na pierwszej stronie pliku PDF:
- FreeOCR
- Prosty OCR
- Bezpłatny OCR do Worda
Krok 2. Użyj swojego narzędzia do wyodrębniania tekstu
Tekst można zwykle zapisać jako zwykły tekst, w formacie Word.doc lub w formacie Rich Text Format (RTF). Format RTF był prekursorem.doc i (podobnie jak.doc) umożliwia zapisywanie formatowania tekstu, marginesów, obrazów i tak dalej w jednym, przenośnym i udostępnianym pliku. Pliki RTF są znacznie większe niż pliki.doc, a ponieważ.doc jest widoczny dla prawie każdego (MS Word ma dostępną bezpłatną przeglądarkę),.doc jest prawdopodobnie najlepszym rozwiązaniem.
Krok 3. Skopiuj i wklej wynikowy tekst do wybranego narzędzia do edycji
Po wklejeniu prawdopodobnie będzie wyglądać na bałagan formatowania, więc będziesz musiał usunąć wiele spacji lub rozbić słowa, które zostały stłoczone. Poziom niechlujności formatowania zależy w dużej mierze od tego, jak czysty był obraz, z którego wyodrębniono tekst.
Krok 4. Edytuj i sformatuj tekst jak zwykle
Jesteś ograniczony pod względem formatowania i to tylko przez aplikację, do której zdecydujesz się wkleić – na przykład najnowsza wersja Microsoft Word zawsze ma znacznie więcej opcji i daje znacznie większą kontrolę niż na przykład Microsoft Notatnik czy nawet Dokumenty Google.