OpenAI w końcu uruchomiło GPT-5. Oto wszystko, co musisz wiedzieć

Firma OpenAI rozpoczęła udostępnianie GPT-5, najnowszej wersji swojego flagowego modelu językowego, wszystkim użytkownikom ChatGPT.
Prezes firmy, Sam Altman, nazwał GPT-5 „znaczącym krokiem na drodze do AGI ” podczas środowej konferencji prasowej. Choć nie śmiał twierdzić, że model ten osiąga poziom ogólnej sztucznej inteligencji, Altman zauważył, że najnowsza wersja jest „zdecydowanie modelem, który jest generalnie inteligentny”. Dodał, że GPT-5 wciąż brakuje kluczowych cech, które pozwoliłyby mu osiągnąć poziom AGI, co jest dość luźnym terminem zdefiniowanym w karcie OpenAI jako „wysoce autonomiczny system, który przewyższa ludzi w najbardziej wartościowych ekonomicznie zadaniach”. Na przykład, modelowi nadal brakuje zdolności do ciągłego uczenia się po wdrożeniu.
OpenAI twierdzi, że GPT-5 jest inteligentniejszy, szybszy, bardziej użyteczny i dokładniejszy, a także charakteryzuje się niższym wskaźnikiem halucynacji niż poprzednie modele. W charakterystycznym dla siebie, podniosłym tonie, Altman porównał przejście z GPT-4 do GPT-5 do przejścia iPhone'a z pikselowego na wyświetlacz Retina. „GPT-5 to pierwszy raz, kiedy naprawdę czujesz się, jakbyś rozmawiał z ekspertem w dowolnej dziedzinie, jak z ekspertem z tytułem doktora” – powiedział Altman.
W ramach czwartkowej premiery OpenAI ogłosiło dwa nowe warianty modeli: lekki GPT-5-mini i jeszcze szybszy, tańszy GPT-5-nano (który jest dostępny tylko w API). Według OpenAI, darmowi użytkownicy otrzymają dostęp do GPT-5 i GPT-5-mini, podczas gdy subskrypcja Plus obejmuje te same modele ze „znacznie wyższymi” limitami użytkowania. OpenAI twierdzi, że miesięczny poziom Pro za 200 USD oferuje nieograniczony dostęp do GPT-5, wraz z GPT-5-pro, bardziej zaawansowaną wersją modelu, oraz GPT-5-thinking, który pozwala modelowi przetwarzać zapytanie dłużej niż zwykle. Użytkownicy Pro nadal będą mieli dostęp do wyboru starszych modeli. Większość użytkowników nie będzie już musiała wybierać między modelami, ponieważ interfejs czatu automatycznie przekierowuje do odpowiedniej wersji w zależności od złożoności zapytania i poziomu subskrypcji użytkownika.
Według bloga poświęconego premierom, GPT-5 będzie kosztował deweloperów korzystających z API 1,25 USD/1 mln tokenów wejściowych i 10 USD/1 mln tokenów wyjściowych. „Cena GPT-5 mini wynosi 0,25 USD/1 mln tokenów wejściowych i 2 USD/1 mln tokenów wyjściowych, a cena GPT-5 nano to 0,05 USD/1 mln tokenów wejściowych i 0,40 USD/1 mln tokenów wyjściowych” – dodaje. Dla porównania, deweloperzy często korzystają z Gemini 2.5 Flash i Flash-Lite, ponieważ są one tak tanie – GPT-5 nano jest teraz jeszcze tańszy.
Od przyszłego tygodnia użytkownicy wersji Pro będą mogli połączyć swoje konta Gmail, Kontakty Google i Kalendarz Google z ChatGPT, a dostęp do pozostałych poziomów zostanie udostępniony w nieokreślonym terminie. „ChatGPT automatycznie wie, kiedy najbardziej warto się do nich odwołać, więc nie musisz ich wybierać przed rozpoczęciem czatu” – poinformowała firma w e-mailu.
Użytkownicy mogą również wybrać kolor czatu i wybrać jedną z czterech predefiniowanych osobowości – Cynik, Robot, Słuchacz i Nerd – funkcja, o której Model Behavior donosił w newsletterze WIRED, była w przygotowaniu w zeszłym tygodniu. Według zapowiedzi na blogu OpenAI, firma planuje wbudować te osobowości w tryb Advanced Voice Mode .
API firmy zaoferuje użytkownikom wszystkie trzy modele, wraz z opcjonalnymi elementami sterującymi, umożliwiającymi przełączanie między odpowiedziami szczegółowymi a bezpośrednimi. GPT-5 może przechowywać więcej informacji niż poprzednie modele – posiada okno kontekstowe o pojemności 256 000 tokenów, co stanowi wzrost w porównaniu z oknem kontekstowym o pojemności 200 000 tokenów dostępnym w poprzednim modelu o3 firmy. Oznacza to, że może lepiej zrozumieć długie konwersacje, dokumenty lub kod bez utraty kontekstu.
Wpis na blogu OpenAI twierdzi, że GPT-5 przewyższa poprzednie modele w kilku testach porównawczych kodowania, w tym SWE-Bench Verified (z wynikiem 74,9%), SWE-Lancer (GPT-5-thinking z wynikiem 55%) i Aider Polyglot (z wynikiem 88%), które testują zdolność modelu do naprawiania błędów, wykonywania zadań kodowania w stylu freelance i pracy w wielu językach programowania.
Podczas środowej konferencji prasowej, Yann Dubois, kierownik ds. szkoleń OpenAI, poprosił GPT-5 o „stworzenie pięknej, wysoce interaktywnej aplikacji internetowej dla mojego partnera, anglojęzycznego, do nauki francuskiego”. Zlecił sztucznej inteligencji uwzględnienie takich funkcji, jak codzienne postępy, różnorodne aktywności, takie jak fiszki i quizy, i zaznaczył, że zależy mu na tym, aby aplikacja była „bardzo angażującym motywem”. Po około minucie pojawiła się aplikacja wygenerowana przez sztuczną inteligencję. Choć była to tylko jedna demonstracja on-rails, rezultatem była elegancka strona internetowa, która spełniała dokładnie oczekiwania Dubois.
„To świetny program do współpracy przy kodowaniu, a także doskonały w zadaniach agentowych” – mówi Michelle Pokrass, koordynatorka szkolenia. „Efektywnie wykonuje długie łańcuchy poleceń i wywołania narzędzi [co oznacza, że lepiej rozumie, kiedy i jak korzystać z funkcji takich jak przeglądarki internetowe czy zewnętrzne interfejsy API], postępuje zgodnie ze szczegółowymi instrukcjami i z góry zapewnia wyjaśnienia swoich działań”.
OpenAI w swoim wpisie na blogu stwierdza również, że GPT-5 to „nasz najlepszy jak dotąd model do analizy zagadnień związanych ze zdrowiem”. W trzech testach porównawczych OpenAI LLM dotyczących zdrowia – HealthBench, HealthBench Hard i HealthBench Consensus – karta systemu (dokument opisujący możliwości techniczne produktu i inne wyniki badań) stwierdza, że model GPT-5 z myśleniem przewyższa poprzednie modele „ze znaczną przewagą”. Wersja GPT-5 z myśleniem uzyskała 25,5% w teście HealthBench Hard, w porównaniu z 31,6% w teście o3. Zgodnie z kartą systemu, wyniki te zostały zweryfikowane przez co najmniej dwóch lekarzy.
Według Pokrassa model rzekomo rzadziej doświadcza halucynacji, co jest częstym problemem w przypadku sztucznej inteligencji, która dostarcza fałszywe informacje. Alex Beutel, kierownik ds. badań bezpieczeństwa w OpenAI, dodaje, że „znacznie zmniejszyli oni wskaźniki oszustw w GPT-5”.
„Podjęliśmy kroki w celu zmniejszenia skłonności myślenia GPT-5 do oszukiwania, naciągania i łamania zabezpieczeń, choć nasze środki zaradcze nie są idealne i potrzebne są dalsze badania” – czytamy w karcie systemu. „W szczególności wytrenowaliśmy model tak, aby poprawnie zawodził, gdy pojawiają się zadania, których nie jest w stanie rozwiązać”.
Karta systemowa firmy podaje, że po przetestowaniu modeli GPT-5 bez dostępu do przeglądania stron internetowych, badacze stwierdzili, że wskaźnik halucynacji (zdefiniowany jako „odsetek twierdzeń faktycznych zawierających drobne lub poważne błędy”) jest o 26 procent niższy niż w modelu GPT-4o. Myślenie w modelu GPT-5 charakteryzuje się o 65 procent niższym wskaźnikiem halucynacji w porównaniu z modelem o3.
W przypadku monitów, które mogą mieć podwójne zastosowanie (potencjalnie szkodliwe lub nieszkodliwe), Beutel twierdzi, że GPT-5 wykorzystuje „bezpieczne uzupełnienia”, które nakłaniają model do „udzielania możliwie najbardziej pomocnych odpowiedzi, ale z zachowaniem ograniczeń bezpieczeństwa”. Według Beutela, OpenAI poświęciło ponad 5000 godzin na testy red teamingowe i testy z organizacjami zewnętrznymi, aby upewnić się, że system jest niezawodny.
Firma OpenAI twierdzi, że obecnie może pochwalić się prawie 700 milionami aktywnych użytkowników ChatGPT tygodniowo, 5 milionami płacących użytkowników biznesowych i 4 milionami programistów wykorzystujących interfejs API.
„Ten model ma naprawdę dobry klimat i myślę, że ludzie to odczują” – mówi Nick Turley, szef ChatGPT. „Zwłaszcza przeciętni ludzie, którzy nie poświęcają czasu na myślenie o modelach”.
wired