10.10.2024 18:00

Imagen 3 dla wszystkich użytkowników. Gemini udostępnia swój generator obrazków AI

Imagen 3, czyli generator obrazków AI od Gemini nie dość, że będzie bardziej precyzyjny niż poprzednia generacja, to do tego dostępny dla wszystkich użytkowników. Cóż to za narzędzie i jak z niego skorzystać?

Gemini 3

Z generatorami obrazkami AI miałem swojego czasu sporo do czynienia. Oczywiście – bardziej w formie rozrywki, chociaż na SLAI, aby oddać charakteru strony, często używałem takich narzędzi, aby stworzyć grafikę wyróżniającą.

Mam swoich faworytów. Niektóre z modelów AI mają swoje indywidualne podejście. Ideogram tworzy świetne obrazy, ale nie radzi sobie z niektórymi promptami i generowaniem konkretnych napisów. Tutaj już Copilot służy pomocą, ale mam wrażenie, że wyniki są… nudne. Z kolei Playground ma smykałkę do realizacji grafik twarzy. Co zatem potrafi Imagen 3 od Gemini?

Imagen 3 od Gemini dostępny dla wszystkich

Imagen 3 ma jedną przewagę. Jest dostępny dla wszystkich za darmo, niezależnie od planu, a więc nie trzeba mieć Gemini Advanced, aby skorzystać z tego generatora obrazków. Żadnych ograniczeń, a takowe często się pojawią w tego typu aplikacjach, np. limit wygenerowanych grafik w ciągu 24 godzin.

W celu skorzystania z Imagen 3 należy wejść na Gemini (działa zarówno w wersji desktopowej, jak i mobilnej) i wpisać prompta. Polecenie powinno na początku zawierać frazę „Wygeneruj obrazek” i dalej wpisujmy opis, co byśmy chcieli, aby program nam stworzył.

Imagen 3 po chwili powinien zaprezentować swoje wyniki, a w zasadzie wynik. Jeden prompt = jedna grafika. Oto przykładowy obrazek, który został wygenerowany na podstawie szybkiego polecenia o treści: Wygeneruj obrazek przedstawiający walkę telefonu z systemem iOS z telefonem z  systemem Android.

Próbny, szybki i krótki prompt w Imagen 3

Imagen 3

Imagen 3 całkiem nieźle sobie radzi z napisami, a jeśli chodzi o generowanie ludzi – jest to losowanie. Raz potrafi to zrobić, a innym razem podaje informacje, że taką możliwość Gemini będzie miało wkrótce. Rozdzielczość generowanych obrazów wynosi 2048×2048 i na razie nie mamy możliwości modyfikacji rozmiarów.

Gemy w Gemini, PinPoint oraz NotebookLM, czyli czego dowiedziałem się na warsztatch Google News Lab

Gemy w Gemini, PinPoint oraz NotebookLM, czyli czego dowiedziałem się na warsztatch Google News Lab

Gemy w Gemini Advanced to nowa funkcja modelu AI od Google, o której dowiedziałem się podczas warsztatów Google News Labs. Bardzo interesująca rzecz, ale to oczywiście niejedyny temat, jaki został…

Imagen 3 wprowadza zaawansowane możliwości generowania obrazów wyposażone we wbudowane środki ochronne i zgodne z zasadami projektowania produktów. W różnych testach porównawczych Imagen 3 wypada korzystnie w porównaniu z podobnymi dostępnymi modelami. Podobnie jak Imagen 2, Imagen 3 używa SynthID – narzędzia Google do znakowania wodnego obrazów generowanych przez AI. Całkiem dobrze zapowiadająca się aplikacja. I co najważniejsze – za darmo i bez limitów dziennych.