Imagen 3, czyli generator obrazków AI od Gemini nie dość, że będzie bardziej precyzyjny niż poprzednia generacja, to do tego dostępny dla wszystkich użytkowników. Cóż to za narzędzie i jak z niego skorzystać?

Z generatorami obrazkami AI miałem swojego czasu sporo do czynienia. Oczywiście – bardziej w formie rozrywki, chociaż na SLAI, aby oddać charakteru strony, często używałem takich narzędzi, aby stworzyć grafikę wyróżniającą.

Mam swoich faworytów. Niektóre z modelów AI mają swoje indywidualne podejście. Ideogram tworzy świetne obrazy, ale nie radzi sobie z niektórymi promptami i generowaniem konkretnych napisów. Tutaj już Copilot służy pomocą, ale mam wrażenie, że wyniki są… nudne. Z kolei Playground ma smykałkę do realizacji grafik twarzy. Co zatem potrafi Imagen 3 od Gemini?

Imagen 3 od Gemini dostępny dla wszystkich

Imagen 3 ma jedną przewagę. Jest dostępny dla wszystkich za darmo, niezależnie od planu, a więc nie trzeba mieć Gemini Advanced, aby skorzystać z tego generatora obrazków. Żadnych ograniczeń, a takowe często się pojawią w tego typu aplikacjach, np. limit wygenerowanych grafik w ciągu 24 godzin.

W celu skorzystania z Imagen 3 należy wejść na Gemini (działa zarówno w wersji desktopowej, jak i mobilnej) i wpisać prompta. Polecenie powinno na początku zawierać frazę „Wygeneruj obrazek” i dalej wpisujmy opis, co byśmy chcieli, aby program nam stworzył.

Imagen 3 po chwili powinien zaprezentować swoje wyniki, a w zasadzie wynik. Jeden prompt = jedna grafika. Oto przykładowy obrazek, który został wygenerowany na podstawie szybkiego polecenia o treści: Wygeneruj obrazek przedstawiający walkę telefonu z systemem iOS z telefonem z  systemem Android.

Próbny, szybki i krótki prompt w Imagen 3

Imagen 3

Imagen 3 całkiem nieźle sobie radzi z napisami, a jeśli chodzi o generowanie ludzi – jest to losowanie. Raz potrafi to zrobić, a innym razem podaje informacje, że taką możliwość Gemini będzie miało wkrótce. Rozdzielczość generowanych obrazów wynosi 2048×2048 i na razie nie mamy możliwości modyfikacji rozmiarów.

Gemy w Gemini, PinPoint oraz NotebookLM, czyli czego dowiedziałem się na warsztatch Google News Lab

Imagen 3 wprowadza zaawansowane możliwości generowania obrazów wyposażone we wbudowane środki ochronne i zgodne z zasadami projektowania produktów. W różnych testach porównawczych Imagen 3 wypada korzystnie w porównaniu z podobnymi dostępnymi modelami. Podobnie jak Imagen 2, Imagen 3 używa SynthID – narzędzia Google do znakowania wodnego obrazów generowanych przez AI. Całkiem dobrze zapowiadająca się aplikacja. I co najważniejsze – za darmo i bez limitów dziennych.