OpenAI przedstawia GPT-5.4 - "model do pracy zawodowej"

OpenAI udostępniło model GPT-5.4 w ChatGPT jako GPT-5.4 Thinking, a także w API i Codex. Równolegle pojawił się też GPT-5.4 Pro — wariant przeznaczony dla osób i zespołów, które potrzebują maksymalnej jakości w złożonych zadaniach. Według OpenAI to obecnie ich najbardziej zaawansowany i wydajny model do pracy profesjonalnej.

Nowy model łączy w jednym systemie rozumowanie, programowanie, pracę z narzędziami i obsługę bardziej złożonych przepływów agentowych. OpenAI podkreśla, że GPT-5.4 ma lepiej radzić sobie z realnymi zadaniami zawodowymi, w tym z tworzeniem i edycją dokumentów, arkuszy kalkulacyjnych oraz prezentacji, a także z działaniem w środowiskach, gdzie trzeba korzystać z wielu narzędzi jednocześnie.

➡️ Czego dowiesz się z tego artykułu:

czym jest GPT-5.4 i gdzie został udostępniony,
czym różni się od wcześniejszych modeli,
jakie ma możliwości w pracy zawodowej,
co zmienia w kodowaniu, pracy z narzędziami i agentach,
dla kogo może być szczególnie przydatny.

Etyka w digital marketingu – nasz obowiązek, nie opcja

Czym jest GPT-5.4

GPT-5.4 to nowy model główny OpenAI zaprojektowany z myślą o pracy profesjonalnej. W praktyce ma być modelem, który lepiej radzi sobie z długimi, wieloetapowymi zadaniami, lepiej utrzymuje kontekst i skuteczniej korzysta z narzędzi. W API zastępuje GPT-5.2 jako główny model ogólnego przeznaczenia, a w Codex przejmuje rolę po GPT-5.3-Codex.

W ChatGPT użytkownicy dostają wariant GPT-5.4 Thinking, który potrafi pracować w trybie bardziej rozumującym. OpenAI wskazuje też, że w ChatGPT model może z góry pokazywać plan swojego toku pracy przy dłuższych i trudniejszych zadaniach, co ma ułatwiać korygowanie kierunku odpowiedzi jeszcze w trakcie generowania wyniku.

Najważniejsze cechy modelu:

nacisk na pracę zawodową i zadania eksperckie,
lepsze utrzymywanie kontekstu,
mocniejsze połączenie rozumowania i użycia narzędzi,
większa przydatność w złożonych przepływach pracy.

Co zmienia się względem wcześniejszych modeli

Najważniejsza zmiana dotyczy połączenia kilku obszarów w jednym modelu. GPT-5.4 ma łączyć możliwości rozumowania znane z GPT-5.2 z kompetencjami kodowymi rozwiniętymi w GPT-5.3-Codex, a do tego lepiej działać w środowiskach z narzędziami, konektorami i bardziej złożonymi zadaniami agentowymi.

OpenAI podaje, że GPT-5.4 poprawia wydajność w kilku ważnych benchmarkach:

GDPval: 83,0% wygranych lub remisów wobec ekspertów branżowych, wobec 70,9% dla GPT-5.2,
BrowseComp: 82,7% wobec 65,8% dla GPT-5.2,
Toolathlon: 54,6% wobec 46,3%,
SWE-Bench Pro: 57,7%, czyli nieco lepiej niż GPT-5.3-Codex i GPT-5.2.

OpenAI deklaruje też poprawę rzetelności odpowiedzi. W zanonimizowanym zestawie promptów, w których wcześniej zgłaszano błędy faktograficzne:

liczba nieprawidłowych pojedynczych stwierdzeń względem GPT-5.2 spadła o 33%,
liczba odpowiedzi zawierających jakiekolwiek błędy zmalała o 18%.

GPT-5.4 w pracy opartej na wiedzy

Jednym z głównych obszarów, na które OpenAI zwraca uwagę, jest praca zawodowa oparta na wiedzy. Chodzi o zadania takie jak:

tworzenie prezentacji sprzedażowych,
budowa modeli finansowych,
redagowanie dokumentów,
przygotowywanie analiz,
praca z arkuszami kalkulacyjnymi.

Właśnie w takich zastosowaniach model ma być bardziej spójny, dokładniejszy i mniej wymagający pod względem liczby poprawek.

OpenAI szczególnie podkreśla poprawę pracy z arkuszami, dokumentami i prezentacjami. W wewnętrznym teście zadań przypominających pracę młodszego analityka bankowości inwestycyjnej:

GPT-5.4 osiągnął średni wynik 87,5%,
GPT-5.2 miał 68,4%.

Z kolei w porównaniach prezentacji oceniający wybierali wyniki GPT-5.4 w 68% przypadków, wskazując na:

lepszą estetykę,
lepsze użycie funkcji generowania obrazu,
większą różnorodność wizualną.

Komputer, przeglądarka i zadania agentowe

GPT-5.4 jest pierwszym głównym modelem OpenAI z natywnymi zdolnościami korzystania z komputera. Oznacza to, że może wspierać agentów wykonujących działania w aplikacjach i na stronach internetowych, zarówno przez analizę zrzutów ekranu, jak i przez sterowanie interfejsem.

OpenAI opisuje to jako duży krok dla programistów budujących agentów realizujących rzeczywiste zadania.

W benchmarkach model wypada wyraźnie lepiej niż wcześniejsze wersje:

OSWorld-Verified: 75,0% wobec 47,3% dla GPT-5.2 i 72,4% dla człowieka,
WebArena-Verified: 67,3%,
Online-Mind2Web: 92,8% przy obserwacji opartej wyłącznie na zrzutach ekranu.

To sugeruje, że model ma być wyraźnie skuteczniejszy w praktycznych scenariuszach:

obsługi komputera,
pracy w przeglądarce,
realizowania działań krok po kroku,
wykonywania zadań w aplikacjach i systemach.

Kodowanie i Codex

W obszarze programowania GPT-5.4 ma zachować silne strony GPT-5.3-Codex, ale lepiej łączyć je z ogólnym rozumowaniem i pracą narzędziową. OpenAI wskazuje, że model dorównuje GPT-5.3-Codex, a miejscami go przewyższa, jednocześnie oferując niższe opóźnienia w różnych procesach rozumowania.

W Codex pojawił się też tryb /fast, który według OpenAI może dawać nawet 1,5 raza większą szybkość tokenów przy tym samym modelu i tej samej inteligencji.

Dodatkowo GPT-5.4 wspiera eksperymentalne okno kontekstu 1M tokenów, co ma znaczenie przy pracy nad:

dużymi repozytoriami,
długimi dokumentami,
rozbudowanymi trajektoriami agentów,
złożonym debugowaniem i iteracją.

Lepsze użycie narzędzi i wyszukiwanie narzędzi

OpenAI mocno akcentuje poprawę współpracy modelu z narzędziami zewnętrznymi. Jedną z nowości jest tool search, czyli wyszukiwanie narzędzi.

Zamiast ładować do kontekstu od razu wszystkie definicje narzędzi, model może wyszukiwać potrzebne definicje dopiero wtedy, gdy są mu potrzebne. To ma:

obniżać koszty,
zmniejszać liczbę tokenów,
przyspieszać działanie agentów,
poprawiać pracę w dużych ekosystemach narzędzi.

W testach OpenAI taka konfiguracja obniżyła łączne zużycie tokenów o 47% przy zachowaniu tej samej dokładności w zestawie zadań MCP Atlas.

Sam model poprawia też sposób wywoływania narzędzi: w Toolathlon osiąga wyższą dokładność niż GPT-5.2 przy mniejszej liczbie tur potrzebnych do wykonania zadania.

Wyszukiwanie w sieci i długie zapytania

GPT-5.4 ma również lepiej radzić sobie z agentowym wyszukiwaniem w internecie. OpenAI pokazuje to na benchmarku BrowseComp, gdzie:

GPT-5.4 osiąga 82,7%,
GPT-5.4 Pro osiąga 89,3%,
GPT-5.2 osiągał 65,8%.

W praktyce ma to oznaczać lepsze działanie przy pytaniach wymagających:

wieloetapowego przeszukiwania wielu źródeł,
szukania trudnych do znalezienia informacji,
syntezy informacji z różnych miejsc,
dłuższego utrzymywania kontekstu.

To ważne szczególnie w pracy:

analitycznej,
badawczej,
eksperckiej,
konsultingowej.

Dostępność i ceny

GPT-5.4 jest wdrażany do ChatGPT, API i Codex.

W ChatGPT:

GPT-5.4 Thinking trafia do użytkowników Plus, Team i Pro,
zastępuje GPT-5.2 Thinking,
GPT-5.4 Pro jest dostępny w planach Pro i Enterprise,
użytkownicy Enterprise i Edu mogą włączyć wcześniejszy dostęp przez ustawienia administratora.

W API:

model jest dostępny jako gpt-5.4,
wariant Pro jest dostępny jako gpt-5.4-pro.

OpenAI zaznacza też, że:

cena GPT-5.4 jest wyższa niż GPT-5.2,
model ma zużywać mniej tokenów w wielu zadaniach,
w efekcie całkowity koszt wykonania pracy może być niższy mimo wyższej stawki jednostkowej,
dokumentacja API wskazuje również 1,05 mln tokenów okna kontekstu i szczegółowe stawki dla wejścia, wyjścia i batch API.

Wskazówki dla specjalistów

Warto traktować GPT-5.4 jako model do zadań, w których liczy się jakość wyniku, spójność i praca wieloetapowa, a nie tylko szybka odpowiedź. Szczególnie dobrze może się sprawdzić przy analizach, pracy z dokumentami, arkuszami i złożonych zadaniach programistycznych.
Zespoły budujące agentów powinny przetestować tool search i długi kontekst, bo to właśnie tam OpenAI pokazuje jedne z największych korzyści praktycznych: mniejsze zużycie tokenów, szybsze odpowiedzi i lepszą pracę w rozbudowanych ekosystemach narzędzi.
W organizacjach warto rozdzielić użycie GPT-5.4 Thinking i GPT-5.4 Pro zależnie od typu zadania. Pro ma sens tam, gdzie wynik musi być maksymalnie dopracowany i trudny do poprawienia po fakcie, natomiast zwykły GPT-5.4 może być bardziej opłacalny w codziennych przepływach pracy.

Nasz komentarz 💬

GPT-5.4 wygląda jak bardzo wyraźny krok w stronę modeli, które mają być nie tylko mądrzejsze, ale po prostu bardziej użyteczne w codziennej pracy zawodowej. Najciekawsze nie są tu nawet same benchmarki, ale to, że OpenAI łączy w jednym modelu kilka obszarów:

rozumowanie,
kodowanie,
pracę z dokumentami,
agentów,
narzędzia.

Z perspektywy firm i specjalistów ważne jest też to, że rozwój modeli coraz wyraźniej idzie w stronę pełnych przepływów pracy, a nie pojedynczych odpowiedzi. To oznacza, że przewagę będą zyskiwać nie tylko ci, którzy umieją dobrze promptować, ale też ci, którzy potrafią zaprojektować cały proces pracy z AI:

od danych i narzędzi,
przez kontrolę jakości,
po wdrożenie wyników.

🔗 OpenAI - Przedstawiamy model GPT‑5.4

➡️ Przeczytaj również artykuł: Czego AI nie zmieni w marketingu – 11 zasad, które zawsze działają - Mimo dynamicznych zmian jedno pozostaje niezmienne – fundamenty skutecznego marketingu. To właśnie one decydują o tym, które marki potrafią się adaptować, rosnąć i budować trwałe relacje z klientami. Oto 11 zasad marketingu, które pozostają aktualne niezależnie od technologii.

Na co dzień działamy skutecznie jako agencja marketingu internetowego. Nasi trenerzy to nie przypadkowe osoby, lecz specjaliści w swych dziedzinach. Swoją wiedzę opierają na wieloletnim doświadczeniu w branży! Jesteśmy agencją z wieloma sukcesami na koncie oraz posiadamy status Google Premier Partner. Masz dzięki temu pewność, że wiedza, którą zdobywasz, nie jest zwykłą teorią, a przetestowaną praktyką.

OpenAI przedstawia GPT-5.4 – „model do pracy zawodowej”