Gemini w systemie macOS

Nieco ponad miesiąc temu opublikowana została aplikacja Gemini dla systemów macOS. Wiele osób upatruje w tym wyprzedzający ruch  firmy z Mountain View. Google w ten sposób może chcieć przyzwyczaić użytkowników macOS do Gemini, zanim Apple szeroko wprowadzi AI do systemów operacyjnych. Tymczasem, po kilku tygodniach testów, mogę się z Wami podzielić wrażeniami i odpowiedzieć na pytanie: Czy warto?

Grafika wygenerowana przez Gemini. Przedstawia biurko, na którym stoi iMac z dużym monitorem. Na ekranie otwarte są dwie aplikacje: przeglądarka internetowa Safari z wyszukiwarką Google oraz interfejs aplikacji Gemini. W przeglądarce widać wyniki wyszukiwania dotyczące korzystania z Gemini na macOS. Obok, w aplikacji Gemini AI, wyświetlane są informacje o zaletach korzystania z Gemini na Macu, takie jak szybkie generowanie streszczeń i analiza dokumentów, pomoc w kodowaniu oraz kreatywne pisanie e-maili i artykułów. Na biurku znajduje się również klawiatura Magic Keyboard, myszka Magic Mouse, roślina doniczkowa oraz smartfon leżący na podstawce. W tle widać półkę z książkami i dekoracjami.

Gemini, gdzie jej szukać?

Zacznijmy od tego, skąd pobrać aplikację. W momencie gdy piszę te słowa, Gemini nie znajdziemy w Mac App Storę. Program musimy pobrać bezpośrednio z internetowej witryny Gemini.

Jeśli jeszcze nie macie zainstalowanej aplikacji na swoich komputerach, możecie do tego użyć poniższego odnośnika:

https://gemini.google/mac/

Na podanej stronie należy kliknąć w odnośnik: Pobierz na Maca. W ten sposób pobierzecie obraz aplikacji. Po jego otwarciu, skopiujcie znajdujący się w nim plik Gemini.app do katalogu Aplikacje.

Przy pierwszym uruchomieniu system macOS zapyta nas czy na pewno chcemy uruchamiać oprogramowanie pobrane z internetu. Później, gdy będziemy próbować korzystać z różnych opcji, przede wszystkim udostępniania okien, jeszcze kilkukrotnie będziemy musieli wyrażać zgody na nagrywanie ekranu, korzystanie z kamery czy mikrofonu. Na szczęście robimy to tylko raz.

Do korzystania z Gemini na komputerze Apple nie potrzebujemy płatnego konta. Ja posiadam konto Pro, więc część opisywanych poniżej opcji może być niedostępna w darmowym pakiecie.

Jak działa Gemini w systemie macOS?

Aplikacja Gemini bardzo mocno integruje się z systemem macOS. Zaczynając od samego uruchamiania wraz z systemem, aż po możliwość analizowania dosłownie każdego otwartego okna. Działa to nieco inaczej niż CoPilot w systemie Windows. Ten ostatni funkcjonuje tylko tam, gdzie przewidzieli to twórcy systemu. Za to wszędzie tam, gdzie on już działa, ma większe możliwości, niż Gemini w ramach udostępnianych jej okien. Na przykład po udostępnieniu Gemini okna edytora tekstu, nie możemy poprosić AI, żeby zmodyfikowała treść udostępnionego dokumentu zmieniając jego treść czy formatowanie.. Z Gemini coś takiego działa jedynie w Google Docx.

Gemini przede wszystkim, za pośrednictwem okna tzw. mini chatu i klasycznego okna aplikacji z typowym chatem z AI, umożliwia zadawanie pytań sztucznej inteligencji. W tym również takich o analizę treści widzianych na ekranie. Na przykład prośba o podsumowanie długiego maila, przygotowanie grzecznej odpowiedzi na niego, streszczenie otwartego dokumentu itp. itd.

Wiadomości do Gemini można pisać lub dyktować. Wystarczy kliknąć w przycisk mikrofonu, podyktować pytanie i kliknąć w przycisk Prześlij. Niestety nie działa to w taki sposób jak znana z aplikacji mobilnych funkcja Rozmawiaj w trybie Live. Tu za każdym razem musimy potwierdzać rozpoczęcie dyktowania i wysyłkę wiadomości. Za to Gemini na komputerze nie zwraca uwagi na głos VoiceOver, który słyszy w tle w trakcie dyktowania. Jest to ogromy plus.

Jednak są też minusy. Już na samym początku przygody z Gemini w systemie macOS, bardzo szybko okazuje się, że ma ona problem ze skrótami klawiszowymi. Standardowy skrót dla mini chatu, tj. Option+Spacja bardzo często wywołujemy przypadkowo przy wprowadzaniu polskich liter. Dlatego w ustawieniach aplikacji warto go zmienić na jakiś inny, na przykład Option+Shift+Spacja, a skrót wywołujący główne okno programu na Command+Option+Shift+Spacja. Na szczęście twórcy nie zapomnieli o możliwości tworzenia własnych skrótów klawiszowych. Dlatego oprócz tych predefiniowanych, możemy ustawić także takie, które dla nas będą najwygodniejsze.

Momentami możemy zaobserwować dziwne zachowanie okna chatu. Na przykład w trakcie pisania jakiegoś zapytania, po naciśnięciu klawisza spacji, okno chatu samoczynnie się zamyka. Problem bierze się stąd, że czasem fokus czytnika ekranu automatycznie przenoszony jest na przycisk Zamknij miniczat. W efekcie, gdy w trakcie wpisywania zapytania naciśniemy spację, okno chatu zostaje zamknięte. W takiej sytuacji po prostu należy klawiszem tabulatora przejść na pole edycyjne i problem zniknie.

Jak korzystać z Gemini w systemie macOS?

Okno chatu z Gemini możemy wywołać w każdym miejscu systemu. Możemy to zrobić skrótem klawiszowym, lub korzystając z ikony Gemini znajdującej się na pasku statusu. Jednak, przynajmniej u mnie, ten drugi sposób nie działa z VoiceOver.

Okno chatu oprócz samego pola edycyjnego zawiera możliwość wyboru modelu Gemini. W chwili pisania tego tekstu skorzystać możemy z jego trzech wersji:

  • Szybki – udziela błyskawicznych odpowiedzi. Niestety, w moim odczuciu pozostawiają one wiele do życzenia i korzystam z niego sporadycznie.
  • Myślący – rozwiązuje złożone problemy. Osobiście uważam go za optymalne rozwiązanie.
  • Pro – do zaawansowanej matematyki i kodowania z wersją 3.1 Pro.

W oknie chatu znajduje się także przycisk Dołącz, po naciśnięciu którego rozwiną się następujące opcje:

  1. Pliki – Opcja pozwala dodawać pliki w najróżniejszych formatach, które później Gemini może dla nas analizować. Na przykład możemy wskazać jej skan jakiegoś dokumentu i poprosić aby nam go odczytała.

    Początkowo stwierdziłem, że to nic nadzwyczajnego. W końcu wszystkie AI to potrafią. Dopóki nie zauważyłem jednej rzeczy która sprawiła, że aktualnie jest to chyba najczęściej wykorzystywana przeze mnie opcja Gemini.

    Okazuje się, że dopóki nie użyjemy przycisku Nowy chat, okienko chatu nie tylko przez określony w ustawieniach czas zapamiętuje kontekst rozmowy, ale także w pamięci zatrzymuje załączony wcześniej dokument. Dzięki temu Gemini może cały czas odpowiadać na pytania dotyczące jego treści. W efekcie działa to jak miniaturowy Notebook LM.

  2. Dysk – Zapewnia dostęp do plików i dokumentów w naszej chmurze od Google. Te dokumenty Gemini może już nie tylko analizować, ale także edytować.
  3. Zdjęcia – Dostęp do zdjęć i filmów przechowywanych w Google Drive. Za pomocą Gemini możemy analizować wykonane zdjęcia lub nagrania video. Możemy też je edytować i modyfikować.
  4. Notebook – Dostęp do utworzonych przez nas notatników. Niezwykle wygodna funkcja. Zamiast korzystać z aplikacji mobilnej lub z przeglądarki, z poziomu chata możemy błyskawicznie odpytywać Gemini o informacje z przygotowanego wcześniej Notebook’a LM. Dla mnie to jedna z najlepszych funkcji Gemini na macOS.
  5. Udostępnij okno – To kolejna z moich ulubionych opcji. Możemy Gemini udostępnić okno dowolnej aplikacji – programu pocztowego, przeglądarki, chatu itd. – i poprosić AI o podsumowanie publikowanych tam treści, rozpoznanie obrazkowego kodu CAPTCHA na stronie, zapytanie o kwestie poruszane na chacie w komunikatorze itp. itd.

    Dużym minusem tej opcji jest ograniczenie analizy do obszaru widzianego na zrzucie ekranowym, jaki wykonuje Gemini. Więc na przykład w kontekście dyskusji toczonej na chacie otrzymamy jedynie wnioski i podsumowanie dotyczące tylko tych elementów, które w danej chwili były widoczne na ekranie. Wcześniejszych wątków poruszanych w dyskusji Gemini już nie uwzględni.

  6. Twórz obraz, Twórz film oraz Twórz muzykę to 3 kreatywne narzędzia, z których korzystam na przykład do tworzenia obrazków prezentujących jakieś zagadnienie. Później umieszczam je we wpisach w Mojej Szufladzie, lub prezentacjach multimedialnych.
  7. Więcej narzędzi to pozycja, która aktualnie skrywa w sobie 3 narzędzia. Zakładam jednak, że będzie ona rozbudowywana o kolejne opcje. Wśród dotychczasowych narzędzi obecnie znajdziemy:
    • Deep research – Funkcja dzięki której możemy poprosić Gemini o gruntowne przeanalizowanie jakiegoś zagadnienia,.
    • Tryb nauki to interaktywny korepetytor, który może pomagać nam w przyswojeniu jakiegoś materiału, odpytywać na przykład z nowych słówek itd.
    • Canvas to kombajn do wspólnej pracy z AI nad jakimś konkretnym projektem. Artykułu, kodu źródłowego aplikacji, prezentacji itp. itd.

Podsumowanie

Osobiście równolegle korzystam z Gemini oraz Chata GPT. Obu narzędzi używam do całkowicie różnych kwestii. W kontekście moich potrzeb i zakresu wykorzystywania ich obu uważam, że doskonale się uzupełniają.

Jednak aplikacja Gemini sprawiła, że aktualnie znacznie częściej sięgam po AI od Google. Jest to po prostu szybsze i wygodniejsze. Wystarczy nacisnąć skrót klawiszowy i już można zacząć pisać. Dodatkowo kilka dni temu Google wprowadziło mega wydajny i szybki, najnowszy model Gemini w wersji 3.5. W efekcie AI od Google w całkiem naturalny sposób stało się ostatnio moim pierwszym wyborem.

Oprócz tradycyjnego chatu najczęściej korzystam z Gemini, gdy odwołuję się do jakiegoś dokumentu, z którym pracuję. Dzięki temu nie muszę przeszukiwać, często słabo dostępnego pliku – w kontekście interesujących mnie informacji. Wystarczy zadać pytanie AI, aby po kilku sekundach w odpowiedzi otrzymać szukany fragment, cytat czy podsumowanie jakiegoś zagadnienia.

Gdy zaczynałem pisać ten tekst, brakowało mi możliwości dodawania z Dysku całych katalogów. Taka funkcja mogłaby stanowić narzędzie do błyskawicznego tworzenia tymczasowych Notebooków LM. I pewnie nie tylko ja miałem takie odczucia, ponieważ jakieś dwa tygodnie temu Google wprowadziło taką opcję. 🙂

Opcja udostępniania okna stanowi dużą pomoc w sytuacji, gdy na przykład w oknie przeglądarki dzieje się coś, czego nie rozumiem. Po udostępnieniu tego okna Gemini, mogę ją poprosić o opisanie zawartości strony, relacji między poszczególnymi elementami a dzięki temu zrozumieć, lub dowiedzieć się czego nie anonsuje mi klasyczna technologia asystująca.

Początkowo obawiałem się, że Gemini będzie miało znacznie większy dostęp do materiałów znajdujących się na dysku mojego komputera. Teraz już wiem, że dostęp ten ma mocno ograniczony. I uważam, że paradoksalnie może to stanowić o przewadze Gemini nad AI, które do swoich systemów operacyjnych planuje wprowadzić Apple. Dlatego też, odpowiadając na pytanie z początku tego artykułu uważam, że warto zainstalować i używać Gemini w środowisku macOS. Szczególnie dla osób z dysfunkcją wzroku może ona stanowić dodatkowe wsparcie i pomoc w codziennej obsłudze komputera.

A jak wyglądają Wasze doświadczenia z pracy z Gemini na komputerach Apple?

2 komentarzy na temat “Gemini w systemie macOS

  1. Niestety, mam zbyt stary komputer, a tak się ucieszyłam z Twojego wpisu.
    Mimo to, dzięki.
    Pozostaje mi Aifon i przeglądarka.
    Pozdrawiam

  2. Może się skusisz na jakiegoś młodziutkiego Maćka Neo? Mnie w pewnym momencie już też zaczęło drażnić, że czegoś tam znowu nie mogę na intelu i w końcu się przesiadłem.

Możliwość komentowania jest wyłączona