OpenAI udostępniło model GPT-5.4 w ChatGPT jako GPT-5.4 Thinking, a także w API i Codex. Równolegle pojawił się też GPT-5.4 Pro — wariant przeznaczony dla osób i zespołów, które potrzebują maksymalnej jakości w złożonych zadaniach. Według OpenAI to obecnie ich najbardziej zaawansowany i wydajny model do pracy profesjonalnej.
Nowy model łączy w jednym systemie rozumowanie, programowanie, pracę z narzędziami i obsługę bardziej złożonych przepływów agentowych. OpenAI podkreśla, że GPT-5.4 ma lepiej radzić sobie z realnymi zadaniami zawodowymi, w tym z tworzeniem i edycją dokumentów, arkuszy kalkulacyjnych oraz prezentacji, a także z działaniem w środowiskach, gdzie trzeba korzystać z wielu narzędzi jednocześnie.
➡️ Czego dowiesz się z tego artykułu:

GPT-5.4 to nowy model główny OpenAI zaprojektowany z myślą o pracy profesjonalnej. W praktyce ma być modelem, który lepiej radzi sobie z długimi, wieloetapowymi zadaniami, lepiej utrzymuje kontekst i skuteczniej korzysta z narzędzi. W API zastępuje GPT-5.2 jako główny model ogólnego przeznaczenia, a w Codex przejmuje rolę po GPT-5.3-Codex.
W ChatGPT użytkownicy dostają wariant GPT-5.4 Thinking, który potrafi pracować w trybie bardziej rozumującym. OpenAI wskazuje też, że w ChatGPT model może z góry pokazywać plan swojego toku pracy przy dłuższych i trudniejszych zadaniach, co ma ułatwiać korygowanie kierunku odpowiedzi jeszcze w trakcie generowania wyniku.
Najważniejsze cechy modelu:

Najważniejsza zmiana dotyczy połączenia kilku obszarów w jednym modelu. GPT-5.4 ma łączyć możliwości rozumowania znane z GPT-5.2 z kompetencjami kodowymi rozwiniętymi w GPT-5.3-Codex, a do tego lepiej działać w środowiskach z narzędziami, konektorami i bardziej złożonymi zadaniami agentowymi.
OpenAI podaje, że GPT-5.4 poprawia wydajność w kilku ważnych benchmarkach:
OpenAI deklaruje też poprawę rzetelności odpowiedzi. W zanonimizowanym zestawie promptów, w których wcześniej zgłaszano błędy faktograficzne:
Jednym z głównych obszarów, na które OpenAI zwraca uwagę, jest praca zawodowa oparta na wiedzy. Chodzi o zadania takie jak:
Właśnie w takich zastosowaniach model ma być bardziej spójny, dokładniejszy i mniej wymagający pod względem liczby poprawek.
OpenAI szczególnie podkreśla poprawę pracy z arkuszami, dokumentami i prezentacjami. W wewnętrznym teście zadań przypominających pracę młodszego analityka bankowości inwestycyjnej:
Z kolei w porównaniach prezentacji oceniający wybierali wyniki GPT-5.4 w 68% przypadków, wskazując na:
GPT-5.4 jest pierwszym głównym modelem OpenAI z natywnymi zdolnościami korzystania z komputera. Oznacza to, że może wspierać agentów wykonujących działania w aplikacjach i na stronach internetowych, zarówno przez analizę zrzutów ekranu, jak i przez sterowanie interfejsem.
OpenAI opisuje to jako duży krok dla programistów budujących agentów realizujących rzeczywiste zadania.
W benchmarkach model wypada wyraźnie lepiej niż wcześniejsze wersje:
To sugeruje, że model ma być wyraźnie skuteczniejszy w praktycznych scenariuszach:
W obszarze programowania GPT-5.4 ma zachować silne strony GPT-5.3-Codex, ale lepiej łączyć je z ogólnym rozumowaniem i pracą narzędziową. OpenAI wskazuje, że model dorównuje GPT-5.3-Codex, a miejscami go przewyższa, jednocześnie oferując niższe opóźnienia w różnych procesach rozumowania.
W Codex pojawił się też tryb /fast, który według OpenAI może dawać nawet 1,5 raza większą szybkość tokenów przy tym samym modelu i tej samej inteligencji.
Dodatkowo GPT-5.4 wspiera eksperymentalne okno kontekstu 1M tokenów, co ma znaczenie przy pracy nad:
OpenAI mocno akcentuje poprawę współpracy modelu z narzędziami zewnętrznymi. Jedną z nowości jest tool search, czyli wyszukiwanie narzędzi.
Zamiast ładować do kontekstu od razu wszystkie definicje narzędzi, model może wyszukiwać potrzebne definicje dopiero wtedy, gdy są mu potrzebne. To ma:
W testach OpenAI taka konfiguracja obniżyła łączne zużycie tokenów o 47% przy zachowaniu tej samej dokładności w zestawie zadań MCP Atlas.
Sam model poprawia też sposób wywoływania narzędzi: w Toolathlon osiąga wyższą dokładność niż GPT-5.2 przy mniejszej liczbie tur potrzebnych do wykonania zadania.
GPT-5.4 ma również lepiej radzić sobie z agentowym wyszukiwaniem w internecie. OpenAI pokazuje to na benchmarku BrowseComp, gdzie:
W praktyce ma to oznaczać lepsze działanie przy pytaniach wymagających:
To ważne szczególnie w pracy:
GPT-5.4 jest wdrażany do ChatGPT, API i Codex.
W ChatGPT:
W API:
OpenAI zaznacza też, że:
GPT-5.4 wygląda jak bardzo wyraźny krok w stronę modeli, które mają być nie tylko mądrzejsze, ale po prostu bardziej użyteczne w codziennej pracy zawodowej. Najciekawsze nie są tu nawet same benchmarki, ale to, że OpenAI łączy w jednym modelu kilka obszarów:
Z perspektywy firm i specjalistów ważne jest też to, że rozwój modeli coraz wyraźniej idzie w stronę pełnych przepływów pracy, a nie pojedynczych odpowiedzi. To oznacza, że przewagę będą zyskiwać nie tylko ci, którzy umieją dobrze promptować, ale też ci, którzy potrafią zaprojektować cały proces pracy z AI: