Witajcie kochani w kolejnym nagraniu z Mojej Szuflady, Piotr Witek się kłania. W dzisiejszym odcinku zapraszam was ponownie na demonstrację możliwości aplikacji Bing tej od Microsoftu, jej sztucznej inteligencji AI, ponieważ pojawiła się tam nowa funkcja umożliwiająca rozpoznawanie grafik, czyli tego wszystkiego co znajduje się na zdjęciach, zrzutach ekranowych itd. W tym celu oczywiście otwieramy sobie aplikację Bing i pod polem edycyjnym, zwróćcie uwagę, pojawiła się taka funkcja Wyszukaj przy pomocy obrazu. W momencie gdy ją aktywujemy, uruchamia się opcja wykonywania zdjęć, ale u samego dołu mamy też przycisk otwarcia biblioteki zdjęć. Ja w tym momencie zdjęć nie będę robił, tylko skorzystam z biblioteki i z tej biblioteki wybiorę sobie zdjęcie, które doskonale znacie z mojej szuflady. Jest to zdjęcie ilustracyjne, na którym widać mnie i Zako, mojego psa przewodnika. I po dodaniu zdjęcia musimy w pole edycyjne wpisać to o co nam chodzi. Ja to już mam wpisane, więc z edycji sobie wkleję, co znajduje się na zdjęciu. I klikamy przycisk prześlij. To jest standardowy komunikat, że nie tylko na zdjęciach, ale w ogóle jak wysyłamy grafikę, Bing informuje, że twarze będą zasłaniane, nie będą rozpoznawane, co niesie za sobą też pewne ograniczenia, istotne z punktu widzenia osób z dysfunkcją wzroku, które chętnie skorzystałyby z dodatkowych informacji typu w jakim ktoś jest wieku. Odebrano wiadomość. Na zdjęciu widać osobę siedzącą na ławce z psem leżącym obok niej. Twarz osoby jest zamazana, aby chronić jej prywatność. Osoba ta ma na sobie szarą marynarkę, niebieską koszulę i niebieskie jeansy. Pies to brązowy Labrador Retriever w zielonej uprzęży z napisem pies asystujący. Ławka jest drewniana i znajduje się na wybrukowanej ścieżce. W tle widać trawnik z drzewami i budynkiem, uśmiech, roześmiane oczy i zarumienione policzki. Zespół informacji jest bardzo, bardzo duży. Mamy informację i, że siedzę na ławce, jaki jest kolor tej ławki, w co jestem ubrany, jakie są kolory tych ubrań i tu wszystko się zgadza bardzo dobrze. Kolor psa się zgadza, kolor jego uprzęży zielone również, napis na uprzęży także. Rasa psa się nie zgadza, bo to nie Labrador, tylko Chesa Pig Bay, ale zwróćcie uwagę ile mamy samych tych wszystkich szczegółów. Jeszcze raz sobie zruchnimy. Na zdjęciu widać osobę siedzącą na ławce z psem leżącym obok niej. Twarz osoby jest zamazana, aby chronić jej prywatność. Osoba ta ma na sobie szarą marynarkę, niebieską koszulę i niebieskie jeansy. Pies to brązowy Labrador Retriever w zielonej uprzęży z napisem pies asystujący. Ławka jest drewniana i znajduje się na wybrukowanej ścieżce. W tle widać trawnik z drzewami i budynkiem. Uśmiech, rozaśmiane oczy i zarumienione poleczki. Ok, no to sprawdźmy czy tu możemy o coś więcej tą aplikację zapytać. Na przykład powiedzmy, że interesuje mnie budynek. Gdzie zostało zrobione? Przestań odpowiadać. Nowy temat. Przycisk. Zapytaj usługę Bing. Zadaj mi pytania. Wielokropek. Punkt wstawiania na koń. Wejście ekranu Braille. Orientacja zablokowana. Napiszmy sobie tak. Orientacja pozioma. Kropki cztery sześć. Wiel- O. Co to za budynek widoczny na zdjęciu i czekamy. Odebrano wiadomość. Niestety nie jestem w stanie określić jaki to budynek widoczny na zdjęciu. Nie mam dostępu do informacji na ten temat, ani możliwości przeprowadzenia odwrotnej wyszukiwarki obrazów. Uśmiech, rozaśmiane oczy i zarumienione poleczki. Buźka. To są niektóre minusy jakie niesie ze sobą ta usługa. Czyli z jednej strony może nam bardzo szczegółowo opisać to co widać na zdjęciu, ale jakaś głębsza interakcja często jest niemożliwa. Niemożliwa jest z kilku powodów. Jedne to są warunki prywatności, czyli nie opisze mi jak ktoś wygląda. Jego twarzy, fryzury, tego czy nosi okulary czy też nie. Druga rzecz to często próbuje aplikacja bazować też na metadanych plików graficznych. Jeśli czegoś w tych metadanych nie ma, no to on też się tymi informacjami z nami nie podzieli. Nie będzie dodatkowo analizował zdjęcia. Po prostu stwierdził, że ta grafika, ten plik, tych dodatkowych informacji nie posiada, więc on po prostu nam tych informacji nie dostarczy. No ale okej. Tu tak gada, to sprawdźmy dodając inne zdjęcie, jak to może działać. Znowu wybierzmy sobie z biblioteki jakąś fotkę. Dobra. Tu mam zrzut ekranu z aplikacji treningowej. To jest słabe, że tutaj zawsze przynajmniej ja muszę szukać tych pól edycyjnych. I tu znowu, żeby nie pisać to z edycji sobie wkleję pytanie co znajduje się na zdjęciu. I klikniemy sobie prześlij. No i zobaczymy co na tym screenie z aplikacji zegarkowej odnajdzie Bing, o czym nas poinformuje. Bo tak jak wspomniałem jest to podsumowanie treningu. I zobaczmy co on tam znajdzie. Jak widzicie bardzo dużo szczegółów dotyczących kolorów, dotyczących tego co zostało rozpoznanie na ekranie, czyli napisy same takie. Ale mamy też grafikę, więc spróbujmy dopytać go o tą grafikę. Gdzie tu mamy to? Znowu pola edycyjne. To jest to czego ja nie lubię w Bingu bardzo. Czyli właśnie poszukanie. Dopytajmy go. Skoro był pierścień aktywności to zapytajmy. Czy pierścień aktywności został zamknięty. Bo takiej informacji nie mieliśmy, więc możemy spróbować doprecyzować taką informację dodając jakieś takie dodatkowe pytania. Odebrano wiadomość. Tak, na zdjęciu widać, że pierścień aktywności został zamknięty. Oznacza to, że osoba korzystająca z aplikacji osiągnęła swój dzienny cel aktywności fizycznej. Gratulacje, uśmiech, roześmiane oczy i zarumienione policzki, buśta. Czyli widzicie, że pewna informacja, która gdzieś tam się pojawiła, dodatkowo w formie graficznej, mieliśmy tylko najpierw informację o istnieniu jakiegoś tam obiektu. Tutaj mogliśmy doprecyzować, dopytać jak to wygląda dokładnie. Czyli informacja zawarta w grafice, która w pierwszej wersji nie została nam dostarczona, tylko była informacja o grafice, a nie było informacji podanej tej treści, jaką niesie ze sobą ta dodatkowa grafika. Mogliśmy uzyskać ją po zadaniu dodatkowego pytania. OK, no to sprawdźmy w takim razie jeszcze jakąś inną fotkę. – Historia czatu. Przycisk. Użyj mikrofonu. Wyszukaj przy użyciu obrazu. – Wyszukaj przy użyciu obrazu. – Smart camera search more. Fotolibrary. Przycisk. – I tu znowu dajmy fotolibrary. – Anuluj. Zaznaczam albumy. Zdjęcia. Pasek przewijania do nowego. – Mamy tutaj zdjęcie. – Data. 18 stycznia. – Zdjęcie. – Podgląd. Przycisk. Wybierz z telekonwersacji. – Archiwalne, bo to jeszcze… – Przestań odpowiadać. Wygaszony. Przycisk. Nowy temat. Przycisk. – Zapytaj usługę Bing. Zadanie. – Podkastu kulinarnego Alicji. – Edycja. Rozpoznawanie. Edycja. Zaznacz. Cofnij. Skanuj. Wklej. – I tu znowu zapytamy co znajduje się na zdjęciu. – Prześlij. – Prześlij. No i znowu poczekamy na to co nam Bing znajdzie na tym zdjęciu. – Ja wiem, że tam jest potrawa. Ładnie, nie tylko smacznie przygotowana, ale też ładnie estetycznie podana. – No i zobaczmy co z takiej fotki wyciągnie Bing. – Na zdjęciu widać realistyczne zdjęcie dania na pomarańczowym talerzu. – Danie składa się z podstawy z owsianki z plasterkami banana i pomarańczy ułożonymi na wierzchu. – Plasterki pomarańczy są ułożone w okrągłym wzorze, a plasterki banana w centrum. – Talerz znajduje się na drewnianym stole z widocznym wzorem słojów. – Jest rozmyte i niewidoczny. Uśmiech, roześmiane oczy i zarumienione policzki. – Czyli mamy informację co jest na talerzu, jak to zostało ładnie poukładane, jak owoce zostały zlokalizowane, więc o wiele więcej z takiej grafiki jesteśmy w stanie wyciągnąć wrzucając ją do Binga niż z takiego standardowego tekstu alternatywnego, gdzie najprawdopodobniej, jeśli byśmy natrafili na podobną grafikę na stronie internetowej, pewnie tekst alternatywny dla niej brzmiałby, przynajmniej w tym wypadku, puding ryżowy i tyle. Tutaj mamy bardzo precyzyjny, szeroki opis tego co znajduje się na zdjęciu. I w ten sposób tu mamy informację, że jest to owsianka, a jest to puding ryżowy, czyli tutaj znowu Bing sobie nadinterpretuje, albo po prostu tak interpretuje to, co widać na zdjęciu. Tak jak wcześniej w przypadku psa, gdzie rozpoznał bądź co bądź psa rasy Chesapeake jako Labradora, są to bardzo podobne rasy, tak samo tutaj owsiankę pomylił z pudingiem ryżowym i tu już nie chodzi o samo danie, ale ryż to nie owies. Więc jak gdyby tutaj zawsze musimy brać pod uwagę to, że ta aplikacja może się pomylić. Ja dzisiaj chciałem Wam tylko i wyłącznie zademonstrować możliwości tego narzędzia. Jest ono bardzo fajne, aczkolwiek nadal te możliwości sztucznej inteligencji są tutaj wyraźnie ograniczone, bo na mojej szufladzie możecie sobie poczytać transkrypcję z prezentacji albo posłuchać w języku angielskim podcastu, w którym testerzy usługi Be My Eyes, wirtualny asystent, demonstrują nową funkcję bazującą właśnie na sztucznej inteligencji, która znacznie głębiej wchodzi w interakcję z grafikami, która znacznie dokładniej jest w stanie opowiadać o różnych rzeczach i co istotne, przynajmniej tak to wygląda w wersji testowej, tam nie ma takich ograniczeń prywatności związanych np. z opisywaniem wyglądu poszczególnych osób, czyli mógłbym, tak jak w przypadku tego pierwszego zdjęcia, mógłbym zapytać właśnie o wygląd osoby na zdjęciu, o jej wiek, czy nosi okulary, jaką ma fryzurę, kolor włosów itd. Tutaj w przypadku Binga nie jestem w stanie tego dokonać i to się pewnie nie zmieni właśnie z uwagi na tę ochronę prywatności, chociaż nie wiem jaki sens tutaj mowa o ochronie prywatności, skoro tak czy tak te dane my widzimy, widzi usługa, skoro my pytamy o to co widać na zdjęciu, te informacje powinny być nam przekazywane, analizowane. Momentami ta usługa działa bardzo fajnie, takim przykładem, który niestety nie udało mi się go Wam zademonstrować, a z którym ostatnio miałem do czynienia, to gdy kupowałem koszulkę, rozmiarówka na stronie internetowej była w formie tabelki, ale tabelki, która została tylko i wyłącznie sfotografowana, czyli wtedy tą grafikę pobrałem sobie do Binga, zapytałem czy jest na zdjęciu, on mnie poinformował, że tabela z rozmiarami, ja wtedy dopytałem jakie wymiary ma rozmiar XL, dowiedziałem się wtedy od Binga co znajduje się kontekstowo właśnie w zakresie tego rozmiaru XL, jakie rozmiary w centymetrach. I w ten sposób powinniśmy próbować wykorzystywać tą aplikację w tym momencie jako takie dodatkowe narzędzie asystujące, ja przynajmniej ze swojej strony do tego typu zastosowań Wam serdecznie polecam Binga. Jeśli już korzystacie z tego narzędzia, to podzielcie się proszę w komentarzach jak Wy z niego korzystacie, bo jakieś nowe zastosowania zawsze są też mile widziane. Na dzisiaj to już wszystko z mojej strony, bardzo Wam dziękuję, oczywiście jeśli jeszcze tego nie zrobiliście, to pamiętajcie o zasubskrybowaniu kanału, żeby nic Wam nie umknęło. I cóż, zapraszam Was do kolejnych vlogów z mojej szuflady, a na dzisiaj kłaniam się nisko, Piotr Witek.