OpenAI DevDay – podsumowanie nowych funkcji, które zmienią świat

Autor: Autor Archiwalny DYSKUSJA: POKAŻ KOMENTARZE Opublikowano: 9.11.2023 10:30

Za nami konferencja OpenAI Dev. Wbrew pozorom to jedno z kluczowych wydarzeń tego roku i już wyjaśniam dlaczego. O firmie stało się głośno rok temu za sprawą wypuszczenia na światło dzienne produktu ChatGPT, który zrewolucjonizował internet. Obecnie producenci poszli o krok dalej. Zapraszam do szczegółowej analizy z omówieniem nowych funkcji.

Firma OpenAI wdarła się przebojem do naszych komputerów i z miejsca zyskała rzesze wyznawców, ponieważ okazało się, że większość naszych codziennych czynności można wielokrotnie przyspieszyć.

Podczas pierwszej konferencji OpenAI przedstawiono plan rozwoju, zapowiedziano nowe produkty, tym samym ogłaszając zdecydowanie nowy format pracy i korzystania z zasobów online. Dlaczego musisz być na bieżąco ze światem AI niezależnie od upodobań? Zapraszam do lektury.

OpenAI z przeglądem nowości

Podczas ostatniego DevDay firma OpenAI zaprezentowała nie tylko szereg nowości i ulepszeń swojej oferty, lecz także obniżki cen wielu elementów swojej platformy. Zmiany ucieszą zwłaszcza deweloperów, którzy bazowali na ich kluczowych produktach.

Wśród nowości znalazły się:

nowy model GPT-4 Turbo, który jest bardziej zaawansowany i tańszy w utrzymaniu,
nowe API dla Asystentów ułatwiające deweloperom tworzenie własnych aplikacji z asystentami AI,
możliwości multimodalne na platformie,
tworzenie obrazów AI (DALL·E 3),
przekształcanie tekstu na mowę (TTS).

GPT-4 Turbo – nowa era modeli językowych

Pierwsza wersja GPT-4 została wydana w marcu. Natomiast ogólną dostępność dla deweloperów udostępniono już w lipcu. W tej chwili firma OpenAI uruchamia kolejną generację tego modelu – GPT-4 Turbo. Jest on bardziej zaawansowany, posiada wiedzę o wydarzeniach światowych do kwietnia 2023 roku i ma okno kontekstowe 128k, co pozwala na przetwarzanie równowartości ponad 300 stron tekstu w jednym zapytaniu. Zoptymalizowana została również jego wydajność – przekłada się na GPT-4 Turbo w cenie 3 razy niższej za tokeny wejściowe i 2 razy niższej za tokeny wyjściowe w porównaniu do GPT-4. Osobiście wykorzystuję ChatGPT-4 w swojej codziennej pracy, dlatego pamiętam, jak wielkim przeskokiem technologicznych możliwości była zmiana z modelu 3.5 na 4. Przede wszystkim pod kątem przetwarzania języka i tempa realizowanych poleceń.

Ulepszona obsługa instrukcji i tryb JSON

GPT-4 Turbo lepiej radzi sobie z zadaniami wymagającymi starannego przestrzegania instrukcji i obsługuje nowy tryb JSON, który ma zapewniać odpowiedź modelu w formacie poprawnego JSON. Nowy parametr API response_format pozwala modelowi ograniczyć jego wyjście do generowania syntaktycznie poprawnego obiektu JSON. A to z kolei przyspiesza pracę z kodem i sprawia, że korzystanie z ChatGPT-4 staje się jeszcze większym usprawnieniem codziennej pracy.

API dla Asystentów, Pobieranie i Interpreter Kodu

OpenAI ogłosił wręcz przełomowy produkt w historii współczesnej technologii – API dla Asystentów. Jest to pierwszy krok w kierunku niesienia pomocy deweloperom w tworzeniu idealnie dostosowanych do ich potrzeb maszyn wspierających codzienne zadania. Asystent jest specjalnie zbudowanym AI, które ma określone instrukcje, korzysta z dodatkowej wiedzy i może wywoływać modele oraz narzędzia do wykonywania zadań, a do tego każda firma może dostosować go do swoich potrzeb.

DALL·E 3 i TTS

Deweloperzy mogą teraz integrować DALL·E 3 bezpośrednio w swoich aplikacjach i produktach przez API obrazów, a także generować mowę naturalną z tekstu za pomocą API text-to-speech. To chyba największa rewolucja ułatwiająca tworzenie i generowanie obrazów, które już teraz zyskują powoli na jakości. A przy tym od razu można stworzyć podsumowanie głosowe stworzonych produktów. O ile sama wtyczka Dall-E 3 już jest dostępna w wersji ChatGPT-4, o tyle przetwarzanie mowy dostępne jest tylko na wybranych systemach i nie w każdej wersji.

Tarcza Praw Autorskich i nowe narzędzia

OpenAI wprowadza Tarczę Praw Autorskich, aby chronić klientów przed roszczeniami dotyczącymi naruszenia praw autorskich. A to z kolei jedno z większych oskarżeń, którymi nieustannie atakowana jest firma OpenAI. O co chodzi? W teorii sama sztuczna inteligencja nie jest w stanie wytworzyć dzieł, kodów, obrazów czy tekstu, które nie bazują na już obecnie stworzonym odpowiedniku. Pojawiają się zatem oskarżenia, że ChatGPT jest po prostu plagiatem bazującym na pracy ludzkich umysłów. Firma OpenAI zamierza się przed tym bronić, jednocześnie powołując się na to, że generatywne AI potrafi samo „tworzyć”. Chociaż fakt przygotowania tarczy przed pozwami trochę martwi.

AI jest zbyt głupia, by ją regulować. Tak twierdzi specjalista z Mety

Podsumowanie

OpenAI DevDay przyniósł wiele zaskakujących ogłoszeń dla deweloperów – od nowych modeli i API, po obniżki cen i nowe możliwości. Innowacje te otwierają nowe horyzonty dla twórców aplikacji i przedsiębiorstw, umożliwiając tworzenie bardziej zaawansowanych i dostosowanych do potrzeb rozwiązań opartych na sztucznej inteligencji. Przy tym, z niesamowicie imponującym tempem, rozwija się cała strategia wprowadzania AI na rynek z wielkim rozmachem. Trzeba przyznać, że wychodzi ona całkiem skutecznie.