Postęp w sferze AI od twórców ChatGPT
Firma podkreśla, że nowy model będzie szczególnie przydatny dla inżynierów, naukowców, programistów. Na poniższej grafice widać, jak bardzo model o1 przewyższa poprzednie wersje, a także ludzkiego eksperta (w ostatnim przykładzie). Porównań dokonano w oparciu o trzy wyzwania: matematyczne, programistyczne oraz naukowe (na poziomie PhD, czyli naszego polskiego doktoratu).
Źródło: YouTube OpenAI
Ponadto firma wprowadza usługę pro. Jak utrzymuje OpenAI, wersja o1 jest obecnie najpotężniejszą na świecie - jeśli nie liczyć jeszcze potężniejszej, jaką jest o1 pro. Na poniższej grafice widać, jak model o1 pro radzi sobie z zaawansowanymi wyzwaniami z zakresu matematyki oraz nauki na poziomie PhD. Owa wersja może być używana w płatnym wydaniu ChatGPT pro.
Źródło: YouTube OpenAI
Modele o1 oraz o1 pro są również krokiem naprzód w kontekście niezawodności i wiarygodności. Użytkownikom zależy na tym, by dostarczane przez ChatGPT informacje były użyteczne, a także by nie musieli ich ciągle weryfikować w zewnętrznych źródłach. OpenAI dokłada starań, by to umożliwić, co przedstawia poniższa grafika.
Źródło: YouTube OpenAI
Trochę o modelu o1 w ChatGPT
OpenAI podkreśla, że o1 to pierwszy model, który “myśli, zanim odpowie”. Można by żartobliwie dodać, że sztuczna inteligencja jest ostrożniejsza i waży słowa, nim je wypowie - co, biorąc pod uwagę wydajność modelu, pokrywa się ze stanem rzeczywistym. Co to oznacza? Że odpowiedzi są dokładniejsze i lepsze od innych modeli AI, z którymi mogliśmy mieć styczność. OpenAI postawiło również na
multimodalność o1. Multimodalność to wielokanałowy i wielokodowy przekaz informacji, który łączy słowo, obraz, dźwięk, a także istotne dla nich tło komunikacyjne i kulturowe.
W wersji o1 pro użytkownicy mogą poprosić model, by wykorzystał
większą moc obliczeniową w celu myślenia jeszcze intensywniej i lepiej rozwiązywał najbardziej złożone zagadnienia, o jakie go zapytamy.
OpenAI dodaje, że najnowsze modele będą przydatne nie tylko dla zaawansowanych zadań matematycznych czy programistycznych. Przydadzą się także w codziennych, prostszych czynnościach.
Firma zadbała o to, by proces myślowy o1 był płynniejszy - wiele feedbacków od użytkowników mówiło bowiem, że, wpisując nawet najprostszą komendę, AI analizowało ją o wiele za długo, nawet do 10 sekund, niejako “szukając dziury w całym”, podczas gdy odpowiedź była prosta i dosłownie “miało ją przed oczami”. W związku z tym od teraz:
o1 odpowie szybko, jeśli zadamy mu proste pytanie,
o1 odpowie wolniej, ale dokładniej, jeśli zadamy mu złożone pytanie.
Nowy model popełnia ok. 34% mniej błędów niż o1-preview, a także skomplikowane procesy myślowe przeprowadza ok. 50% szybciej niż o1-preview. To zmiana na tyle duża, że bez wątpienia zauważalna. Zadaliśmy o1 pytanie: “Wymień wszystkich królów Polski, poczynając od Bolesława Chrobrego, a kończąc na ostatnim władcy, który rządził w XII wieku. Wypisz listę królów, podając ich imiona, nazwiska, daty królowania oraz po jednej małej ciekawostce o każdym z nich.” Oto odpowiedź:
Co istotne, o1 odpowiedział na pytanie bardzo precyzyjnie - w istocie wymienił jedynie królów Polski, czyli władców koronowanych, noszących ten tytuł, a nie niekoronowanych władców (np. książąt), którzy mogli sprawować władzę w mniej formalny sposób - takiej bowiem odpowiedzi udzielił model 4o. Zaproponowane przez o1 informacje pokrywają się z
artykułem o królach Polski w Wikipedii.
Kolejną istotną kwestią jest wspomniana już multimodalność i rozumowanie. Specjaliści z OpenAI pracowali nad systemem, dzięki któremu AI będzie w stanie rozumieć więcej niż tylko tekst, np. prowadzić dialog i obliczenia na podstawie zaimportowanych grafik. I tak właśnie zrobiono - zaimportowano zdjęcie prostego schematu narysowanego na kartce papieru, a następnie poproszono AI o rozwiązanie określonego problemu. W dostarczonych danych celowo pominięto jeden z parametrów (temperaturę), istotnych dla całego zadania, co model AI inteligentnie zauważył i podkreślił, a następnie sam przyjął szacowaną wielkość, na podstawie której dokonał dalszych obliczeń, które finalnie okazały się prawidłowe.
Źródło: YouTube OpenAI
Jeśli chodzi o o1 pro, tak jak wspomnieliśmy, model najczęściej jest wykorzystywany do rozwiązywania zaawansowanych problemów matematycznych czy programistycznych. Zadano mu pytanie z dziedziny chemii, z którym - co istotne - model o1-preview radził sobie raczej, kolokwialnie mówiąc, bez fajerwerków. Przedstawiony problem wymaga złożonego myślenia, wzięcia pod uwagę wielu zmiennych, rozważenia różnych punktów widzenia, słowem - wymaga specjalistycznej wiedzy i eksperckiego podejścia. Model o1 pro wywiązał się z powierzonego mu problemu bardzo dobrze, przedstawiając rozwiązanie oraz ścieżkę rozumowania.
Źródło: YouTube OpenAI
Podsumowując:
model o1 jest szybszy i dokładniejszy od modelu o1-preview,
o1 potrafi rozumować w oparciu o nie tylko tekst, ale i grafikę,
o1 pro stanowi świetne wsparcie przy najtrudniejszych zagadnieniach z dziedziny matematyki i nauk ścisłych.
OpenAI pracuje nad możliwościami dodawania plików do modelu o1 czy uzbrojenie go w narzędzie do przeglądania sieci. Czekamy na kolejne uaktualnienia i informacje w tej materii.
Źródło informacji: oficjalny kanał OpenAI na YouTube.
➡️
Ten artykuł może Cię zaciekawić: AI i reklama w social media. Jak algorytmy uczą się preferencji użytkowników?