Zaprezentowano usługę Sora od OpenAI! Nadchodzi rewolucja w generowaniu materiałów wideo?
Sora od OpenAI to nowa usługa generatywnej sztucznej inteligencji, która będzie tworzyć zjawiskowe materiały wideo. Wcale nie przesadzam z górnolotnymi słowami, ponieważ zaprezentowane próbki wyglądają naprawdę wyjątkowo i charakteryzują się wysoką jakością obrazu.
Sora może generować filmy przez około minutę, zachowując jakość wizualną i zgodność z instrukcjami użytkownika. Nowy moduł AI będzie w stanie generować złożone sceny z wieloma elementami, określonymi rodzajami ruchu oraz dokładnymi szczegółami tematu i tła. Model zrozumie nie tylko to, o co użytkownik poprosił, ale także to, jak części tego polecenia prezentują się w świecie fizycznym. OpenAI rozpoczyna testy i przedstawia próbki wideo.
Sora od OpenAi to rewolucja w generowaniu wideo?
Sora ma działać podobnie jak inne programy i narzędzia, które przetwarzają tekst na wideo. Widać jednak, że będzie to zupełnie inny standard. Niezwykła płynność, ostrość i imitacja rzeczywistości. To żywy film, dzięki któremu firmy będą w stanie zaprezentować swój produkt. Widzę ogromny potencjał w rękach profesjonalistów w dziedzinach: film i telewizja. Oczywiście pod warunkiem, że finalnie Sora będzie generować wysokojakościowe materiały. OpenAI zwraca również uwagę na słabości swojej nowej usługi.
Może mieć problem z dokładną symulacją fizyki złożonej sceny i może nie rozumieć konkretnych przypadków przyczyny i skutku. Na przykład osoba może ugryźć ciasteczko, ale później ciasteczko może nie mieć śladu ugryzienia. Model może również mylić szczegóły przestrzenne monitu, na przykład mieszając lewy i prawy, może zmagać się z dokładnymi opisami zdarzeń, które mają miejsce w określonym czasie, jak podążanie określoną trajektorią kamery.
Próbne materiały wideo wygenerowane przez Sorę prezentują się olśniewająco!
Sora ma być teraz testowana przez zaufanych partnerów. OpenAI chce dopracować nową usługę przede wszystkim pod kątem bezpieczeństwa. Firma chce uniknąć sytuacji, w których wygenerowane materiały będą zawierać treści seksualne, podobizny celebrytów lub elementy ekstremalnej przemocy.
Recenzja TP-Link Tapo D230S1. Inteligentny dzwonek z kamerą, który chcesz kupić
Sora opiera się na wcześniejszych badaniach modeli DALL · E i GPT. Wykorzystuje technikę znaną z DALL · E 3, która polega na generowaniu wysoce opisowych podpisów danych treningu wizualnego. W rezultacie model jest w stanie wierniej postępować zgodnie z instrukcjami tekstowymi użytkownika w wygenerowanym filmie.
Sora jest także w stanie przetworzyć istniejące zdjęcie w dynamiczny materiał wizualny. Model będzie mógł również pobrać istniejący film, rozszerzyć go lub wypełnić brakujące w nim ramki. Kiedy nastąpi premiera nowej usługi? Nie wiadomo. Jestem zaintrygowany i jednocześnie przerażony kierunkiem rozwoju AI. Kiedy nastąpi moment, gdy ludzie będą hurtowo tracić pracę, bo w pewnych segmentach rynku nie będą już potrzebni?
Próbki wideo wygenerowane przez usługę Sora możecie sprawdzić pod tym adresem.