Artykuł – Dostępny OCR w środowisku iOS

Tym razem kilka słów na temat dostępnych programów OCR na system iOS. Jest to drugi tekst z cyklu poświęconego aplikacjom rozpoznającym różne rzeczy, który opublikowany został w czasopiśmie Mój Mac Magazyn,
Oczywiście z zawartością wszystkich numerów, możecie zapoznać się odwiedzając archiwum MMM.
Logo Mój Mac Magazyn

Dostępny OCR w środowisku iOS

Funkcja OCR (ang. Optical Character Recognition – optyczne rozpoznawanie znaków) obecnie występuje w wielu mobilnych aplikacjach używanych przez nas na co dzień. Przykładowo Tłumacz Google rozpozna i przetłumaczy tekst znajdujący się w kadrze aparatu, a Evernote umożliwi przeszukanie treści na wykonanych przez nas zdjęciach paragonów, rachunków czy biletów pod kątem zadanych słów kluczy. W AppStore znajduje się jednak o wiele więcej programów, których podstawowym zadaniem jest rozpoznawanie i wyodrębnianie tekstu z fotografii.

Mobilne aplikacje OCR najczęściej wykorzystywane są do szybkiego zarchiwizowania informacji, którą chcemy jeszcze przetwarzać w jakiś inny, dodatkowy sposób. Najlepszym tego przykładem jest wykonanie zdjęcia danych kontaktowych z ulotki bądź wizytówki, a następnie po rozpoznaniu tekstu, stworzenie na jego podstawie nowego kontaktu w naszej książce adresowej. Bywają jednak sytuacje, w których technologia OCR potrafi zastąpić człowiekowi jeden ze zmysłów. I nie są to sporadyczne, hipotetyczne przypadki.

Mowa tu oczywiście o osobach mających trudności z czytaniem. O ludziach słabo widzących, niewidomych, seniorach czy zmagających się z poważną dysleksją. Za pomocą aplikacji rozpoznającej tekst zainstalowanej w mobilnym urządzeniu, będą oni w stanie zapoznać się z wieloma, w normalnych okolicznościach niedostępnymi dla nich informacjami, w rodzaju menu w restauracji, zawartością papierowej korespondencji czy treścią dowolnej ulotki reklamowej. Jednak aby to wszystko było możliwe, program OCR powinien spełniać dwa podstawowe warunki: musi dobrze rozpoznawać tekst oraz być w pełni dostępny dla osób o specjalnych potrzebach. Niestety spełnienie tych dwóch warunków drastycznie ogranicza wachlarz dostępnych możliwości. Mimo to, poniżej przedstawiam cztery, moim subiektywnym zdaniem, najbardziej interesujące mobilne aplikacje OCR dostępne dla osób posiadających trudności z czytaniem.

TextGrabber

TextGrabber stworzony został przez firmę ABBY, światowego potentata w dziedzinie technologii OCR. Sam ten fakt sprawia, że jakość rozpoznawanego tekstu, możliwa w ponad sześćdziesięciu językach, jest na prawdę bardzo dobra. Dodatkową zaletę programu stanowi opcja odsłuchania odnalezionej treści za pomocą systemowego syntezatora mowy.

Niska cena w stosunku do jakości oferowanego OCR, a także rozpoznawanie tekstu bez konieczności posiadania dostępu do Internetu sprawiają, że dla wielu użytkowników będzie to idealne rozwiązanie. Minusem może być jedynie interfejs w języku angielskim oraz coś, co przede wszystkim dotknie osoby niewidome, tj. występujące już od kilku wersji TextGrabber, automatyczne wyciszanie głosu systemowego programu odczytu ekranu VoiceOver w momencie uruchomienia aplikacji OCR.

Prizmo

Za to aplikacja Prizmo posiada już cały szereg udogodnień wspierających osoby z dysfunkcją wzroku. Należą do nich m.in. głosowe i wibracyjne wskazówki podpowiadające niewidzącemu użytkownikowi czy fotografowany obiekt znajduje się w kadrze i czy obiektyw ustawiony jest pod odpowiednim kątem. Prizmo, podobnie jak TextGrabber, posiada również możliwość odsłuchania rozpoznanej treści, polski interfejs oraz przetwarzanie obrazu na tekst z poziomu samego urządzenia.

Niestety, ponieważ polski pakiet językowy nie stanowi integralnej części programu, należy go sobie doinstalować z poziomu Ustawień. Sprawia to jednak, zgodnie z ostrzeżeniami producenta, że w nader odczuwalny sposób aplikacja spowalnia działanie i znacząco wydłuża czas rozpoznawania tekstu. Osoby korzystające z VoiceOver dodatkowo zmartwi informacja, że od kilku ostatnich aktualizacji, Prizmo potrafi skutecznie zawiesić działanie systemowego programu odczytu ekranu.

KNFB Reader

Za sprawą doskonałego silnika OCR działającego lokalnie w naszym urządzeniu, KNFB Reader jest aplikacją niezwykle wydajną i efektywną. Wystarczy ją uruchomić, zrobić zdjęcie tekstu i po kilku sekundach program syntetycznym głosem zacznie nam odczytywać rozpoznaną treść. Wcześniej wymienione programy wymagają od użytkownika o wiele więcej interakcji zanim umożliwią mu zapoznanie się ze sfotografowaną informacją.

KNFB Reader, podobnie jak Prizmo, obok polskiego interfejsu i polskiego języka rozpoznawania, oferuje użytkownikowi dodatkowe głosowe i wibracyjne podpowiedzi o ułożeniu obiektywu względem fotografowanej powierzchni. W przeciwieństwie jednak do Prizmo i TextGrabber, KNFB Reader doskonale radzi sobie również z rozpoznawaniem tekstu na innych, nietypowych powierzchniach w rodzaju ekranu komputera, opakowań produktowych czy różnych elektronicznych wyświetlaczy.

BookScanner Pro

Na sam koniec, koniecznie muszę wspomnieć o BookScanner Pro, czyli kolejnym produkcie ze stajni ABBY. W przeciwieństwie do wcześniej wymienionych programów, nie jest on jednak aplikacją służącą do szybkiego pozyskiwania informacji. Od jego uruchomienia do zapoznania się ze sfotografowanym tekstem zazwyczaj upływa kilka dobrych minut. Wynika to stąd, że jest to rozwiązanie dedykowane osobom skanującym wielostronicowe teksty. Idealnie sprawdzi się np. uczniom czy studentom rozpoznającym w ten sposób skrypty lub krótkie publikacje, a także osobom zmuszonym do zapoznawania się z treścią dłuższych dokumentów, w pracy, banku czy urzędzie.

Jakość rozpoznanego przez BookScanner tekstu z poprawnie wykonanych zdjęć jest wręcz idealna. I to, obok pełnej dostępności samego programu, stanowi chyba największy plus tej aplikacji. Niestety, posiada ona również swoje minusy. Należą do nich przede wszystkim mało intuicyjny interfejs w języku angielskim oraz konieczność posiadania dostępu do Internetu. W tym przypadku za jakość rozpoznanego tekstu odpowiadają zewnętrzne serwery firmy ABBY.

Podsumowanie

Osobiście uważam KNFB Reader za najlepszą aplikację OCR dla osób z dysfunkcją wzroku. Nie ma też w tym nic dziwnego, ponieważ właśnie w tym celu, wspierania osób mających problemy z czytaniem, została ona stworzona. Po uruchomieniu aplikacji dosłownie jedno stuknięcie w ekran dzieli użytkownika od zapoznania się z treścią informacji wydrukowanej na papierze, cyfrowym wyświetlaczu czy tablicy informacyjnej wiszącej na ścianie.

Aktualnie jedynym i największym minusem KNFB Reader jest jego wysoka cena. Zazwyczaj jest to koszt rzędu 90€ ale często można trafić na promocje zaczynające się już od 30€. Tak więc jeśli używacie jakichś programów generujących alerty cenowe, to warto do listy obserwowanych aplikacji dodać KNFB Reader. Z resztą podobnie możecie postąpić z każdym z wymienionych programów, ponieważ wszystkie one są płatne.

Bezpośrednie linki do pobrania opisywanych aplikacji z AppStore: