OpenAI zaprezentowało światu nową odsłonę swojego niezwykle popularnego ChatuGPT. Ten w wersji premium nie tylko z nami porozmawia tekstowo, ale także głosowo. Będzie też potrafił rozpoznawać obrazki i identyfikować jego poszczególne elementy.
Sztuczna inteligencja w wydaniu ChatGPT od OpenAI przeszła sporą metamorfozę przez ostatnie kilka miesięcy – zwłaszcza jeśli za nią płaciliście. Teraz zadebiutował w końcu ich czatbot w wersji 4.0, który ma być jeszcze bardziej zaawansowany i pomocny dla użytkowników.
W nowym oświadczeniu OpenAI poinformowało, że nowe funkcje będą dostępne dla płatnych użytkowników ChatuGPT. Ci nie tylko będą mogli porozmawiać z chatbotem głosowo (ten odpowie nam swoim głosem), ale również podzielić się z nim zdjęciami, pytając się o jego konkretne elementy za pośrednictwem narzędzia do zaznaczania.
Firma podzieliła się wideo, w którym zaprezentowała możliwości nowej wersji ChatuGPT na przykładzie obniżania siodełka w rowerze. Widzimy jak użytkownik robi zdjęcie sprzętu, a następnie prosi ChatGPT o pomoc. Najpierw otrzymuje ogólnikowe rozwiązanie problemu, a następnie prosi o nieco dokładniejsze zdjęcie, by lepiej zarysować kontekst sytuacyjny.
ChatGPT będzie teraz mówił i rozpoznawał elementy zdjęcia
Widzimy, że po zrobieniu następnego zdjęcia i zaznaczeniu interesującej nas części zdjęcia, ChatGPT zareagował, pisząc, że chodzi o inne miejsce i tłumacząc dalej. To pokazuje, jak bardzo zaawansowana jest sztuczna inteligencja w aplikacji od OpenAI, która nie tylko zidentyfikowała element zdjęcia, ale też wiedziała konkretnie, co to za część roweru i jak sobie z nim poradzić.
Trzeba przyznać, że jest to całkiem imponująca rzecz i aż ciekawe, jak bardzo skomplikowane mechanizmy apka będzie mogła zrozumieć i rozłożyć na czynniki pierwsze.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Plus urocze jest również to, że użytkownik na końcu podziękował ChatowiGPT – wiecie, żeby nie zdenerwować naszych przyszłych mechanicznych imperatorów.
Firma tłumaczy też, że oczywiście ma w planach jeszcze inne funkcje rozpoznawania przedmiotów na zdjęciach – możecie np. zrobić fotkę zawartości swojej lodówki i ChatGPT pomoże wam podsunąć przepisy na różnego rodzaju dania ze składników, które macie. Możecie też podesłać zdjęcie jakiegoś budynku i apka postara się wam opowiedzieć jego historię.
Zostając przy opowiadaniu historii – druga z nowych zaawansowanych funkcji ChatuGPT opiera się właśnie na tym, czyli na mówieniu. W kolejnym wideo opublikowanym przez OpenAI, firma chwali się nowym głosem swojego chatbota, który w materiale opowiada nam historyjkę o „super ekstra jeżu o imieniu Larry”, co jest nawiązaniem do kampanii promocyjnej apki DALL E 3.
W materiale ChatGPT zaczyna nam opowiadać historię o stworku, kiedy po kilkunastu sekundach użytkownik wcina się w wypowiedź czatu, pytając o to, w jakim domu mieszkał Larry – wszystko po to, by pokazać poziom zaawansowania sztucznej inteligencji i tego, jak dobrze bot potrafi naśladować ludzkie interakcje.
Przydatna jest też funkcja „przerywania” wypowiedzi ChatuGPT, klikając po prostu w ikonkę mikrofonu – możemy się bowiem zapytać o więcej szczegółów na temat tego, o czym w tym momencie czatbot mówi albo po prostu zmienić temat, jeśli dowiedzieliśmy się już wystarczająco dużo. To może się na przykład przydać w przypadku szykowania potraw, kiedy chcemy się dopytać o jakiś składnik, jego pochodzenie, czy cenę.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023
Nowe funkcje mają się stać aktywne na przestrzeni kolejnych dwóch tygodni i tylko dla użytkowników Premium i Enterprise. Włączyć je będziemy mogli w ustawieniach aplikacji ChatGPT na urządzeniach z systemami Android i iOS. Firma pochwaliła się również tym, że będzie oferowała 5 różnych głosów, których posłuchać możecie teraz na stronie OpenAI.
Jednocześnie firma zaznaczyła, żeby nie spodziewać się od razu perfekcji od nowych funkcji ChatuGPT. OpenAI współpracowało z kilkoma organizacjami, żeby uniknąć problemów z błędami natury naukowej, czy też upewnić się, że użytkownicy nie będą mogli przeprowadzić z czatbotem rozmowy o tematach ekstremalnych i ekstremistycznych. Firma zaznaczyła też, że korzystała z pomocy ludzi, którzy stworzyli apkę Be My Eyes, która pomaga osobom z problemami z wzrokiem.
Krótko mówiąc nie spodziewajcie się, że naprawicie dzięki ChatowiGPT silnik samolotu (a przynajmniej nie bez kilku aktualizacji). Wymiana przerzutek w rowerze? To zdaje się być bardziej prawdopodobne.