Istnieje wiele usług lub gotowych produktów do OCR dokumentów. Nie zawsze jednak chcemy z nich korzystać. Przedstawię różne podejścia do problemu oraz bardziej szczegółowo jak samodzielnie użyć darmowego i open source silnika do OCR Tesseract wykorzystując Tess4j w Javie. Pokażę również jak przygotować obrazy do tego procesu oraz w jaki sposób obrobić dane po wyciągnięciu tekstu. Nie zabraknie praktycznych przykładów (szczególny nacisk położyłem na OCR kopert).
Nasza strona internetowa używa plików cookies (tzw. ciasteczka) w celach statystycznych, reklamowych oraz funkcjonalnych. Dzięki nim możemy indywidualnie dostosować stronę do twoich potrzeb. Każdy może zaakceptować pliki cookies albo ma możliwość wyłączenia ich w przeglądarce, dzięki czemu nie będą zbierane żadne informacje.
W trosce o komfort korzystania z naszego serwisu chcemy dostarczać Ci coraz lepsze usługi oraz materiały redakcyjne. By móc to robić prosimy, abyś wyraził zgodę na dopasowywanie treści marketingowych do Twoich zachowań w serwisie. Zgoda ta pozwoli nam częściowo finansować rozwój świadczonych usług.
Pamiętaj, że dbamy o Twoją prywatność. Nie zwiększymy zakresu naszych uprawnień bez Twojej zgody. Zadbamy również o bezpieczeństwo Twoich danych. Wyrażoną zgodę możesz wycofać w każdej chwili.
Wyrażenie powyższych zgód jest dobrowolne i możesz je w dowolnym momencie wycofać (na podstronie z ustawieniami prywatności), odznaczając wybraną zgodę i klikając przycisk "nie zgadzam się", z tym, że wycofanie zgody nie będzie miało wpływu na zgodność z prawem przetwarzania na podstawie zgody, przed jej wycofaniem.
Komentarze (0)