OpenAI przedstawia GPT-5.4 – „model do pracy zawodowej”

OpenAI udostępniło model GPT-5.4 w ChatGPT jako GPT-5.4 Thinking, a także w API i Codex. Równolegle pojawił się też GPT-5.4 Pro — wariant przeznaczony dla osób i zespołów, które potrzebują maksymalnej jakości w złożonych zadaniach. Według OpenAI to obecnie ich najbardziej zaawansowany i wydajny model do pracy profesjonalnej.

Nowy model łączy w jednym systemie rozumowanie, programowanie, pracę z narzędziami i obsługę bardziej złożonych przepływów agentowych. OpenAI podkreśla, że GPT-5.4 ma lepiej radzić sobie z realnymi zadaniami zawodowymi, w tym z tworzeniem i edycją dokumentów, arkuszy kalkulacyjnych oraz prezentacji, a także z działaniem w środowiskach, gdzie trzeba korzystać z wielu narzędzi jednocześnie.

➡️ Czego dowiesz się z tego artykułu:

  • czym jest GPT-5.4 i gdzie został udostępniony,
  • czym różni się od wcześniejszych modeli,
  • jakie ma możliwości w pracy zawodowej,
  • co zmienia w kodowaniu, pracy z narzędziami i agentach,
  • dla kogo może być szczególnie przydatny.

Czym jest GPT-5.4

GPT-5.4 to nowy model główny OpenAI zaprojektowany z myślą o pracy profesjonalnej. W praktyce ma być modelem, który lepiej radzi sobie z długimi, wieloetapowymi zadaniami, lepiej utrzymuje kontekst i skuteczniej korzysta z narzędzi. W API zastępuje GPT-5.2 jako główny model ogólnego przeznaczenia, a w Codex przejmuje rolę po GPT-5.3-Codex.

W ChatGPT użytkownicy dostają wariant GPT-5.4 Thinking, który potrafi pracować w trybie bardziej rozumującym. OpenAI wskazuje też, że w ChatGPT model może z góry pokazywać plan swojego toku pracy przy dłuższych i trudniejszych zadaniach, co ma ułatwiać korygowanie kierunku odpowiedzi jeszcze w trakcie generowania wyniku.

Najważniejsze cechy modelu:

  • nacisk na pracę zawodową i zadania eksperckie,
  • lepsze utrzymywanie kontekstu,
  • mocniejsze połączenie rozumowania i użycia narzędzi,
  • większa przydatność w złożonych przepływach pracy.


Co zmienia się względem wcześniejszych modeli

Najważniejsza zmiana dotyczy połączenia kilku obszarów w jednym modelu. GPT-5.4 ma łączyć możliwości rozumowania znane z GPT-5.2 z kompetencjami kodowymi rozwiniętymi w GPT-5.3-Codex, a do tego lepiej działać w środowiskach z narzędziami, konektorami i bardziej złożonymi zadaniami agentowymi.

OpenAI podaje, że GPT-5.4 poprawia wydajność w kilku ważnych benchmarkach:

  • GDPval: 83,0% wygranych lub remisów wobec ekspertów branżowych, wobec 70,9% dla GPT-5.2,
  • BrowseComp: 82,7% wobec 65,8% dla GPT-5.2,
  • Toolathlon: 54,6% wobec 46,3%,
  • SWE-Bench Pro: 57,7%, czyli nieco lepiej niż GPT-5.3-Codex i GPT-5.2.

OpenAI deklaruje też poprawę rzetelności odpowiedzi. W zanonimizowanym zestawie promptów, w których wcześniej zgłaszano błędy faktograficzne:

  • liczba nieprawidłowych pojedynczych stwierdzeń względem GPT-5.2 spadła o 33%,
  • liczba odpowiedzi zawierających jakiekolwiek błędy zmalała o 18%.

GPT-5.4 w pracy opartej na wiedzy

Jednym z głównych obszarów, na które OpenAI zwraca uwagę, jest praca zawodowa oparta na wiedzy. Chodzi o zadania takie jak:

  • tworzenie prezentacji sprzedażowych,
  • budowa modeli finansowych,
  • redagowanie dokumentów,
  • przygotowywanie analiz,
  • praca z arkuszami kalkulacyjnymi.

Właśnie w takich zastosowaniach model ma być bardziej spójny, dokładniejszy i mniej wymagający pod względem liczby poprawek.

OpenAI szczególnie podkreśla poprawę pracy z arkuszami, dokumentami i prezentacjami. W wewnętrznym teście zadań przypominających pracę młodszego analityka bankowości inwestycyjnej:

  • GPT-5.4 osiągnął średni wynik 87,5%,
  • GPT-5.2 miał 68,4%.

Z kolei w porównaniach prezentacji oceniający wybierali wyniki GPT-5.4 w 68% przypadków, wskazując na:

  • lepszą estetykę,
  • lepsze użycie funkcji generowania obrazu,
  • większą różnorodność wizualną.

Komputer, przeglądarka i zadania agentowe

GPT-5.4 jest pierwszym głównym modelem OpenAI z natywnymi zdolnościami korzystania z komputera. Oznacza to, że może wspierać agentów wykonujących działania w aplikacjach i na stronach internetowych, zarówno przez analizę zrzutów ekranu, jak i przez sterowanie interfejsem.

OpenAI opisuje to jako duży krok dla programistów budujących agentów realizujących rzeczywiste zadania.

W benchmarkach model wypada wyraźnie lepiej niż wcześniejsze wersje:

  • OSWorld-Verified: 75,0% wobec 47,3% dla GPT-5.2 i 72,4% dla człowieka,
  • WebArena-Verified: 67,3%,
  • Online-Mind2Web: 92,8% przy obserwacji opartej wyłącznie na zrzutach ekranu.

To sugeruje, że model ma być wyraźnie skuteczniejszy w praktycznych scenariuszach:

  • obsługi komputera,
  • pracy w przeglądarce,
  • realizowania działań krok po kroku,
  • wykonywania zadań w aplikacjach i systemach.

Kodowanie i Codex

W obszarze programowania GPT-5.4 ma zachować silne strony GPT-5.3-Codex, ale lepiej łączyć je z ogólnym rozumowaniem i pracą narzędziową. OpenAI wskazuje, że model dorównuje GPT-5.3-Codex, a miejscami go przewyższa, jednocześnie oferując niższe opóźnienia w różnych procesach rozumowania.

W Codex pojawił się też tryb /fast, który według OpenAI może dawać nawet 1,5 raza większą szybkość tokenów przy tym samym modelu i tej samej inteligencji.

Dodatkowo GPT-5.4 wspiera eksperymentalne okno kontekstu 1M tokenów, co ma znaczenie przy pracy nad:

  • dużymi repozytoriami,
  • długimi dokumentami,
  • rozbudowanymi trajektoriami agentów,
  • złożonym debugowaniem i iteracją.

Lepsze użycie narzędzi i wyszukiwanie narzędzi

OpenAI mocno akcentuje poprawę współpracy modelu z narzędziami zewnętrznymi. Jedną z nowości jest tool search, czyli wyszukiwanie narzędzi.

Zamiast ładować do kontekstu od razu wszystkie definicje narzędzi, model może wyszukiwać potrzebne definicje dopiero wtedy, gdy są mu potrzebne. To ma:

  • obniżać koszty,
  • zmniejszać liczbę tokenów,
  • przyspieszać działanie agentów,
  • poprawiać pracę w dużych ekosystemach narzędzi.

W testach OpenAI taka konfiguracja obniżyła łączne zużycie tokenów o 47% przy zachowaniu tej samej dokładności w zestawie zadań MCP Atlas.

Sam model poprawia też sposób wywoływania narzędzi: w Toolathlon osiąga wyższą dokładność niż GPT-5.2 przy mniejszej liczbie tur potrzebnych do wykonania zadania.

Wyszukiwanie w sieci i długie zapytania

GPT-5.4 ma również lepiej radzić sobie z agentowym wyszukiwaniem w internecie. OpenAI pokazuje to na benchmarku BrowseComp, gdzie:

  • GPT-5.4 osiąga 82,7%,
  • GPT-5.4 Pro osiąga 89,3%,
  • GPT-5.2 osiągał 65,8%.

W praktyce ma to oznaczać lepsze działanie przy pytaniach wymagających:

  • wieloetapowego przeszukiwania wielu źródeł,
  • szukania trudnych do znalezienia informacji,
  • syntezy informacji z różnych miejsc,
  • dłuższego utrzymywania kontekstu.

To ważne szczególnie w pracy:

  • analitycznej,
  • badawczej,
  • eksperckiej,
  • konsultingowej.

Dostępność i ceny

GPT-5.4 jest wdrażany do ChatGPT, API i Codex.

W ChatGPT:

  • GPT-5.4 Thinking trafia do użytkowników Plus, Team i Pro,
  • zastępuje GPT-5.2 Thinking,
  • GPT-5.4 Pro jest dostępny w planach Pro i Enterprise,
  • użytkownicy Enterprise i Edu mogą włączyć wcześniejszy dostęp przez ustawienia administratora.

W API:

  • model jest dostępny jako gpt-5.4,
  • wariant Pro jest dostępny jako gpt-5.4-pro.

OpenAI zaznacza też, że:

  • cena GPT-5.4 jest wyższa niż GPT-5.2,
  • model ma zużywać mniej tokenów w wielu zadaniach,
  • w efekcie całkowity koszt wykonania pracy może być niższy mimo wyższej stawki jednostkowej,
  • dokumentacja API wskazuje również 1,05 mln tokenów okna kontekstu i szczegółowe stawki dla wejścia, wyjścia i batch API.

Wskazówki dla specjalistów

  • Warto traktować GPT-5.4 jako model do zadań, w których liczy się jakość wyniku, spójność i praca wieloetapowa, a nie tylko szybka odpowiedź. Szczególnie dobrze może się sprawdzić przy analizach, pracy z dokumentami, arkuszami i złożonych zadaniach programistycznych.
  • Zespoły budujące agentów powinny przetestować tool search i długi kontekst, bo to właśnie tam OpenAI pokazuje jedne z największych korzyści praktycznych: mniejsze zużycie tokenów, szybsze odpowiedzi i lepszą pracę w rozbudowanych ekosystemach narzędzi.
  • W organizacjach warto rozdzielić użycie GPT-5.4 Thinking i GPT-5.4 Pro zależnie od typu zadania. Pro ma sens tam, gdzie wynik musi być maksymalnie dopracowany i trudny do poprawienia po fakcie, natomiast zwykły GPT-5.4 może być bardziej opłacalny w codziennych przepływach pracy.

Nasz komentarz 💬

GPT-5.4 wygląda jak bardzo wyraźny krok w stronę modeli, które mają być nie tylko mądrzejsze, ale po prostu bardziej użyteczne w codziennej pracy zawodowej. Najciekawsze nie są tu nawet same benchmarki, ale to, że OpenAI łączy w jednym modelu kilka obszarów:

  • rozumowanie,
  • kodowanie,
  • pracę z dokumentami,
  • agentów,
  • narzędzia.

Z perspektywy firm i specjalistów ważne jest też to, że rozwój modeli coraz wyraźniej idzie w stronę pełnych przepływów pracy, a nie pojedynczych odpowiedzi. To oznacza, że przewagę będą zyskiwać nie tylko ci, którzy umieją dobrze promptować, ale też ci, którzy potrafią zaprojektować cały proces pracy z AI:

  • od danych i narzędzi,
  • przez kontrolę jakości,
  • po wdrożenie wyników.

🔗 OpenAI - Przedstawiamy model GPT‑5.4
➡️ Przeczytaj również artykuł: Czego AI nie zmieni w marketingu – 11 zasad, które zawsze działają - Mimo dynamicznych zmian jedno pozostaje niezmienne – fundamenty skutecznego marketingu. To właśnie one decydują o tym, które marki potrafią się adaptować, rosnąć i budować trwałe relacje z klientami. Oto 11 zasad marketingu, które pozostają aktualne niezależnie od technologii.
Na co dzień działamy skutecznie jako agencja marketingu internetowego. Nasi trenerzy to nie przypadkowe osoby, lecz specjaliści w swych dziedzinach. Swoją wiedzę opierają na wieloletnim doświadczeniu w branży! Jesteśmy agencją z wieloma sukcesami na koncie oraz posiadamy status Google Premier Partner. Masz dzięki temu pewność, że wiedza, którą zdobywasz, nie jest zwykłą teorią, a przetestowaną praktyką.
Szkolenia
Polski