OCR dokumentów w praktyce - Marcin Kowalczyk

Opublikowany 2020-12-13 16:53:25

  • autor: Anonim
127
Istnieje wiele usług lub gotowych produktów do OCR dokumentów. Nie zawsze jednak chcemy z nich korzystać. Przedstawię różne podejścia do problemu oraz bardziej szczegółowo jak samodzielnie użyć darmowego i open source silnika do OCR Tesseract wykorzystując Tess4j w Javie. Pokażę również jak przygotować obrazy do tego procesu oraz w jaki sposób obrobić dane po wyciągnięciu tekstu. Nie zabraknie praktycznych przykładów (szczególny nacisk położyłem na OCR kopert).

Marcin Kowalczyk
Programista, BMS sp. z o.o.

Komentarze (0)


Drogi Czytelniku!

W trosce o komfort korzystania z naszego serwisu chcemy dostarczać Ci coraz lepsze usługi oraz materiały redakcyjne. By móc to robić prosimy, abyś wyraził zgodę na dopasowywanie treści marketingowych do Twoich zachowań w serwisie. Zgoda ta pozwoli nam częściowo finansować rozwój świadczonych usług.

Pamiętaj, że dbamy o Twoją prywatność. Nie zwiększymy zakresu naszych uprawnień bez Twojej zgody. Zadbamy również o bezpieczeństwo Twoich danych. Wyrażoną zgodę możesz wycofać w każdej chwili.

Wyrażenie powyższych zgód jest dobrowolne i możesz je w dowolnym momencie wycofać (na podstronie z ustawieniami prywatności), odznaczając wybraną zgodę i klikając przycisk "nie zgadzam się", z tym, że wycofanie zgody nie będzie miało wpływu na zgodność z prawem przetwarzania na podstawie zgody, przed jej wycofaniem.