Gemy w Gemini Advanced to nowa funkcja modelu AI od Google, o której dowiedziałem się podczas warsztatów Google News Labs. Bardzo interesująca rzecz, ale to oczywiście niejedyny temat, jaki został poruszony na tym spotkaniu. Zapraszam do krótkiego podsumowania, w którym przybliżę również temat takich narzędzi jak PinPoint i NotebookLM.

Będę szczery – średnio mi się chciało iść na warsztaty, organizowane przez Google. O narzędziach AI i budowaniu promptów wiedzę mam całkiem sporą, a poza tym z modeli sztucznej inteligencji raczej nie korzystam. Preferuję samodzielne tworzenie treści.

Jednak – niczego nie żałuje. Było to bardzo owocne spotkanie, bo zauważyłem potencjał w jednym z narzędzi. Ja nie chcę uchodzić za specjalistę od wszystkiego i niczego, a niestety wiele pomocy AI do tego się sprowadza. Jednak – stworzyć sobie przestrzeń do przyśpieszenia pracy poprzez już napisany przez siebie – nawet dłuższy, autorski, kreatywny tekst? Google ma moją uwagę!

Gemy w Gemini

Gemy w Gemini

Gemy w Gemini to zdecydowanie coś niezwykle interesującego. Jest to nowa opcja w modelu AI od Google i polega ona na tworzeniu osobistych ekspertów AI specjalizujących się w dowolnym temacie. Dzięki nim zaoszczędzimy sporo czasu – zapamiętają one szczegółowe instrukcje i pomogą w powtarzalnych lub trudnych zadaniach. Ja tutaj odnajduje całkiem sporo możliwości dla osób tworzących swoje treści i modyfikujących ich formę, które następnie wrzucają na swoje social media. Każda z platform ma inne standardy i wytyczne, chociażby jeśli chodzi o liczbę znaków.

Przykładowo: tworzymy długi tekst na jakiś temat. Wędruje on na witrynę internetową. Tworzymy Gema (czyli upraszczając: szablon), który tak zmodyfikuje treść, aby wrzucić ją na swoje social media. Oczywiście musimy napisać odpowiedniego prompta, w jaki sposób ta zawartość ma zostać zmieniona. Jednak robimy to tylko raz. Następnie wrzucamy treść swojego artykułu i Gem powinien dostosować go do danej platformy, czyli na Facebooku dorzuci emotikony, na Instagramie użyje hasztagów, a na X wyciągnie esencję i zmniejszy liczbę znaków. To oczywiście tylko przykład, a wykorzystanie Gemów zależy tylko od naszych potrzeb i kreatywności.

Gemy w Gemini możemy wykorzystać jako wsparcie w rozumieniu skomplikowanych treści, dostarczy nam inspiracji, zrobi burzę mózgów, poprawi tekst pod kątem językowym, czy pomoże w samorozwoju zawodowym. Kwintesencja jest prompt. Dobrze napisana, szczegółowa komenda zakotwiczona w danym Gemie usprawni nam pracę. Wystarczy dodać do niej temat, aby za każdym razem szczegółowo nie opisywać problemu. Bardzo ciekawa innowacja.

Gemy są dostępne na urządzeniach stacjonarnych i mobilnych użytkownikom Gemini Advanced, Gemini Business i Gemini Enterprise w ponad 150 krajach i w większości języków. Dotyczy to również Polski, ale zdecydowanie polecam używania języka angielskiego w celu zwiększenia liczby lepszych wyników.

Pinpoint

Gemy w Gemini
fot. materiały prasowe Google

Ciekawym narzędziem jest również Pinpoint, które szczególnie może się przydać dziennikarzom śledczym, którzy przeglądają setki kartek materiału, aby zrobić z niego rzetelny artykuł. Przeszuka on ogromne zbiory dokumentów. Możemy przesłać setki tysięcy dokumentów, obrazów, e-maili, odręcznych notatek i plików audio, a także przeszukać je pod kątem konkretnych słów lub wyrażeń, lokalizacji, organizacji i osób.

Jedna kolekcja w Pinpoint może zawierać do 200 tys. dokumentów, w tym obrazów, plików audio i tekstu drukowanego. Wykorzystuje technologię OCR i zamiany mowy na tekst, aby umożliwić wyszukiwanie tekstu w plikach tekstowych, a także na obrazach i plikach audio – w wielu językach.

Ponadto narzędzie te jest w stanie utworzyć transkrypcję. Można przesyłać pliki audio trwające do 2 godzin, z których Pinpoint utworzy plik tekstowy. Działa również w języku polskim. Sprawdzone – całkiem sprawnie przetwarza tekst. Nie musiałem wprowadzać zbyt wiele poprawek.

NotebookLM

Gemy w Gemini
fot. materiały prasowe Google

NotebookLM to z kolei nieco eksperymentalne narzędzie od Google, które zadebiutowało w 2023 roku. Pomaga ono w zrozumieniu złożonych materiałów, znalezieniu powiązań między informacjami i szybszym przygotowaniu pierwszej wersji roboczej. Można przesłać źródła, np. notatki z badań, transkrypcje wywiadów, dokumenty firmowe, a NotebookLM natychmiast stanie się ekspertem w określonej dziedzinie.

Aktualizacja rozszerza zakres działań. Nowe funkcje obejmują:

  • Oprócz dokumentów Google, PDF-ów i plików tekstowych NotebookLM obsługuje teraz prezentacje Google i adresy URL całych stron internetowych jako źródła
  • Cytaty w tekście przenoszą teraz bezpośrednio do odpowiednich fragmentów w źródłach, dzięki czemu można łatwo zweryfikować odpowiedź AI lub zagłębić się w oryginalny tekst
  • Przewodnik po notatniku ułatwia zrozumienie źródeł przez konwertowanie ich na przydatne formaty, takie jak Najczęstsze pytania, dokumenty z podsumowaniem czy przewodniki

Google podał przykłady, w jakich użytkownicy wykorzystali te narzędzie. Dzięki kanałowi na Discord liczącym ponad 14.000 użytkowników można zainspirować się i odkryć nowe, dosyć nieoczywiste sposoby użycia NotebookLM.

Na przykład powieściopisarze i autorzy fanfików używali narzędzia NotebookLM, aby porządkować złożone fabuły, a entuzjaści gier fabularnych konsultowali w nim szczegółowe opisy światów fantasy w grach takich jak Dungeons and Dragons

Specjaliści od wszystkiego i niczego

To według mnie najciekawsze narzędzia, jakie zaprezentował Google na swoich warsztatach. Pragnę jeszcze zwrócić uwagę na Google Flood Hub, które udostępnia prognozy pogody z 7-dniowym wyprzedzeniem w 80 krajach.

[PODCAST] iPhone 16 Pro w naszych rękach, wycieka nowy model Kindle czy kupiłem zepsuty aparat

Ponadto ciekawym rozwiązaniem jest SyntID, które pozwala na pozostawienie znaku wodnego w obrazach wygenerowanych przez nas w Imagen 3. To wszystko jednak uruchamia w mojej głowie jedną, zatrważającą myśl.

Czy wkrótce będziemy specjalistami od wszystkiego i niczego? To jednak już temat na oddzielny artykuł. Na pewno wrócę z garścią moich przemyśleń. Póki co – najbardziej zostałem zainteresowany Gemami w Gemini, bo to świetna pomoc każdego użytkownika, który tworzy dużo treści – nawet bez wykorzystania AI.