Witajcie kochani w kolejnym nagraniu z mojej szuflady, Piotr Witek się kłania. W dzisiejszym odcinku zapraszam was na demonstrację kolejnego już narzędzia, które umożliwia osobom niewidomym rozpoznawanie obrazów, opisywanie tychże obrazów na różnego rodzaju grafikach, zdjęciach. Jednak to narzędzie różni się od pozostałych łatwością użycia. Jak ono działa? Wystarczy skorzystać z jednego gestu, takiego, który sobie przypiszecie, aby na urządzeniu mobilnym wykonać ten gest. Wykonuje się wtedy zrzut ekranu, który wysyłany jest do narzędzia ChatGPT, gdzie z wykorzystaniem już tutaj ChatGPT w wersji 4.0 rozpoznawany jest obraz i w odpowiedzi otrzymujecie opis danej grafiki. Możecie oczywiście dopytywać o szczegóły, co się znajduje na tej grafice. Nic nie trzeba udostępniać, jeden gest załatwia sprawę. Oczywiście nie ja jestem autorem tego rozwiązania, tylko Aaron Ramirez opisywał to rozwiązanie w serwisie AppleVis. Możecie stamtąd sobie pobrać skrót, ale też skrót, który dzisiaj Wam demonstruję. Ja pozwoliłem sobie spolszczyć, bo założyłem, że część z Was może nie chcieć korzystać ze skrótu w języku angielskim. I taki skrót wraz z opisami, jak skonfigurować go sobie, wszystkie linki znajdziecie zarówno w mojej szufladzie, jak i w opisie do tego nagrania. Jak to działa? Tak jak wspomniałem, wykonujemy zrzut ekranu i możemy dopytywać o szczegóły. Kiedy nam to może być przydatne? W najróżniejszych sytuacjach, najczęściej wtedy, gdy ktoś odwołuje się do grafiki. Ja z taką sytuacją najczęściej mam do czynienia w mediach społecznościowych, na przykład na Twitterze czy obecnie X, w serwisie X, ktoś pisze, zobaczcie, co sądzicie? I wrzuca grafikę oczywiście bez tekstu alternatywnego. I w takiej sytuacji ja sięgam po mój magiczny gest i co się wtedy dzieje? Zobaczcie, ja otwieram teraz Twittera i mam tutaj wpis Patryka Olszanowskiego, otwieram. To jest zupełnie doskonała osoba, nie znam człowieka. Wyświetlił mi się przed chwilą jego tweet i co my tu mamy? Jak brzmi wpis? Obserwuj. Więcej akcji. Spłonę w piekle, czaszka. Spłonę w piekle i czaszka. Pienowo, obrazek. No i do tego oczywiście jest obrazek, który nie jest w żaden sposób opisany. Tutaj stukam, poczekajcie, bo mi tu sugestia wskoczyły, już zamykamy. Dobra, i mam obrazek, ja go sobie powiększam, stukam w niego dwukrotnie palcem, żeby mi się otworzył na cały ekran. I teraz korzystam z mojego gestu, ja sobie tutaj przypisałem gest czterokrotnego stuknięcia dwoma palcami, więc stukam sobie raz, dwa, trzy. Jeszcze raz, bo mi się uruchomił YouTube. Co konkretnie interesuje Cię na tym obrazie? To pole nie jest obowiązkowe. I teraz pojawia się pytanie, co konkretnie interesuje Cię na tym obrazie? To już jest pytanie ze skrótu, jest to informacja u góry ekranu mniej więcej. My możemy tutaj albo wpisać, co nas interesuje, ale ponieważ jeszcze nie wiemy, co tam jest, to możemy od razu kliknąć przycisk gotowe. W tym momencie screen, który został wykonany, tak jak wspomniałem wcześniej, wysyłany jest na serwer chata GPT, rozpoznawany i już otrzymaliśmy odpowiedź. Ten dźwięk to sygnalizuje. Mamy informację, ile kosztowała ta operacja. Przedstawia dwie sceny. W górnej części widzimy dwa różowe świnie na tle niebieskiego nieba i brązowej ziemi. Większa świnia, wyglądająca na zdenerwowaną, mówi do mniejszej świnki, Twój ojciec się w ugrobie przewraca. W dolnej części obrazka widzimy hot doga na grillu, co sugeruje, że ojciec małej świnki został przetworzony na kiełbasę. Obok grilla znajdują się żółta i czerwona butelka z przyprawami oraz szczypce. No wiemy już, dlaczego, skąd się wziął taki, a nie inny komentarz do wpisu. Został nam opisany bardzo dokładnie komiks, który znajdował się na grafice. Ja myślałem, że to będzie jakieś zdjęcie, a tutaj mamy dokładny opis. Oczywiście możemy wykorzystywać ten gest w najróżniejszych sytuacjach, nie tylko jak ktoś nie opisuje tekstem alternatywnym zdjęć, ale też i tutaj przykład właśnie. Odpaliłem YouTube'a, mamy tutaj nagranie jednego z moich filmików i ja też tutaj stuknę sobie ten gest, raz, dwa, trzy, cztery. Tak, na razie nic mnie konkretnie nie interesuje, daję gotowe. Wysyłany jest zrzut do czata GPT i zobaczymy, co czat mi odpowie. Na obrazie widzimy zrzut ekranu z filmu na YouTube. Na górze ekranu znajduje się tytuł filmu Bityba.pl, czyli sklep zoologiczny w Twoim telefonie oraz nazwa kanału Piotr Witek Moja Szuflada.pl. Obok tytułu znajdują się emotikony psa i kota. W tle widoczne są fragmenty strony internetowej sklepu zoologicznego, na której można zobaczyć produkty marki Rinti, takie jak Rinti Hitsku, małe patyczki do rzucia oraz Rinti Sensible Snacki Insect Bix, owady. Ceny produktów są udanym złotych, np. od 17 zł i 80 groszek. I wyobraźcie sobie, oczywiście możecie sobie zatrzymać ten opis, dotykając z dwoma palcami ekranu. Wyobraźcie sobie, że oglądacie jakiś film na YouTubie, jakiś film instruktażowy, albo ktoś coś opisuje, pokazuje, demonstruje, ale nie opisuje tego, co właśnie robi. I wy chcecie dowiedzieć się, co tam jest na ekranie, wtedy wystarczy zatrzymać odtwarzanie tego nagrania, wykonać gest, o którym wspomniałem, dostać opis, a jeśli ten opis nie będzie Was satysfakcjonował, wystarczy wtedy na pole edycyjne tutaj wejść, kliknąć sobie OK. I tutaj mamy podpowiedź, że możemy jeszcze o coś dopytać, jeśli kliknęliśmy OK. Dobra, ja tutaj sobie włączę braille'a i napiszmy, może opisz patyczki i wykonuję gest taki klasyczny, dwa palce w prawo, czyli Enter, tak jakbym na iMessage wysyłał wiadomość. Oczywiście, gdybyście kliknęli przycisk Gotowe, to tak samo ta wiadomość zostałaby wysłana do czata GPT i mamy odpowiedź. OK, to możemy jeszcze o coś dopytać. Klikam przycisk OK. I dopytajmy na przykład, jaki raz jest na opakowaniu. No i zobaczymy, co nam odpowie. No więc wiemy, że to prawdopodobnie jest Jack Russell Terrier. W ten sposób możecie dopytywać o szczegóły. Nieważne, czy zrobicie sobie stopklatkę na YouTubie, czy przeglądacie media społecznościowe, jest to niezwykle przydatny gest. Według mnie jest to jeden z najlepszych dotychczas sposobów wykorzystania sztucznej inteligencji, no bo po prostu nie musimy niczego nigdzie udostępniać, tylko wykonujemy właśnie kilka stuknięć. Możecie sobie przypisać do tego dowolny gest. Ja ze swojej strony bardzo zachęcam. Pamiętam, że opis jak tego dokonać znajdziecie pod linkami na mojej szufladzie i tutaj pod nagraniem na YouTubie. Oczywiście pamiętajcie, jeśli jeszcze tego nie zrobiliście, o zasubskrybowaniu kanału. Polecajcie go znajomym, tym, którzy jeszcze kanału nie zasubskrybowali, bo co dwa tygodnie wpadnie wam na skrzynkę powiadomienie wtedy, że pojawiła się jakaś nowość ze świata technologii, dostępności, więc warto subskrybować kanał. Ja ze swojej strony dzisiaj bardzo wam dziękuję za uwagę. Kłaniam się nisko i zapraszam was do kolejnych vlogów z mojej szuflady. Piotr Witek