DeepSeek R1 – w praktyce

Świat modeli językowych nieustannie się rozwija, a pojawienie się DeepSeek R1 wzbudziło niemałe zainteresowanie. Czy jest to konkurent dla OpenAI, który może zmienić zasady gry? Specjaliści od AI sprawdzili to w praktyce i podzielili się opinią na temat nowego gracza na rynku.

Czym wyróżnia się DeepSeek R1?


DeepSeek R1 to model z technicznego punktu widzenia otwarty. Jest dość duży – jego łączna liczba parametrów wynosi aż 671 miliardów, co stawia go wśród największych modeli dostępnych na rynku. Niestety, dla wielu osób uruchomienie go lokalnie może być wyzwaniem ze względu na wysokie wymagania sprzętowe. Dla użytkowników indywidualnych przewidziano API, które umożliwia przetestowanie modelu.

Jedną z najbardziej interesujących funkcji DeepSeek R1 jest możliwość wglądu w tzw. reasoning tokens, czyli procesy rozumowania modelu. Pozwala to na zrozumienie, w jaki sposób model dochodzi do swoich odpowiedzi, co jest ciekawym dodatkiem dla entuzjastów i badaczy AI.

Test praktyczny: od prostych aplikacji po zaawansowane scenariusze


Testowanie DeepSeek R1 rozpoczęło się od stworzenia aplikacji w HTML i CSS, która pozwala użytkownikowi przesyłać pliki PDF, a następnie wyodrębniać z nich URL-e i prezentować je w formie klikalnej listy. Model poradził sobie z zadaniem całkiem dobrze – aplikacja działała sprawnie, a proces odbywał się całkowicie po stronie przeglądarki, bez konieczności korzystania z serwerów zewnętrznych.

W kolejnej próbie poszerzono funkcjonalność aplikacji, tak aby mogła pobierać i analizować kolejne PDF-y z odnalezionych linków, tworząc swoisty „łańcuch” eksploracji. Tutaj pojawiły się już ograniczenia techniczne, takie jak restrykcje CORS, które wymagały ręcznego rozwiązania problemu poprzez dodanie serwera. Pomimo tego, model wykazał potencjał i zaprezentował solidne podstawy do budowania bardziej zaawansowanych aplikacji.

Wady i ograniczenia


Choć DeepSeek R1 ma swoje mocne strony, nie jest pozbawiony wad:

  1. Brak wsparcia dla funkcji wywoływania funkcji (function calling) – ogranicza to możliwość budowania bardziej złożonych systemów, takich jak chatboty zintegrowane z narzędziami zewnętrznymi.
  2. Wysoki próg oceny efektywności – nowość modelu sprawia, że trudno ocenić jego realne możliwości w ciągu pierwszych dni testów. Wymaga to dłuższego czasu i bardziej kompleksowych benchmarków.
  3. Nieprecyzyjne wyniki w złożonych scenariuszach – w przypadku bardziej abstrakcyjnych testów, takich jak analiza kontekstu w scenariuszu narracyjnym, model nie zawsze trafiał w sedno, choć był w stanie generować ciekawe propozycje.

Cena jako atut


Jednym z największych atutów DeepSeek R1 jest jego koszt – według twórców cena wynosi zaledwie 2,9 USD za milion tokenów, co w porównaniu do modelu OpenAI o1 (60 USD za milion tokenów) czyni go niezwykle atrakcyjnym rozwiązaniem. To duży krok naprzód w kierunku dostępności AI dla szerokiego grona użytkowników.

Podsumowanie


DeepSeek R1 to interesująca propozycja, która może znaleźć swoje miejsce zarówno wśród profesjonalistów, jak i entuzjastów sztucznej inteligencji. Choć nie jest jeszcze doskonały i wymaga dalszych testów, jego funkcjonalności, cena oraz możliwość wglądu w procesy rozumowania czynią go modelem godnym uwagi. Z niecierpliwością czekamy na kolejne aktualizacje i rozwój tego projektu, aby móc w pełni wykorzystać jego potencjał.

➡️ Przeczytaj również: OpenAI o3 – kolejny przełom w technologii czy marketingowy trik?
➡️ Zapraszamy do naszej Akademii Marketing Online. Jesteś marketerem, który chce zautomatyzować swoją pracę i tworzyć bardziej efektywne treści marketingowe? Lub jesteś copywriterem, chcącym przyspieszyć proces tworzenia treści i generowania nowych pomysłów za pomocą Chat GPT? Chcesz korzystać z Midjourney do tworzenia unikalnych grafik i wizualizacji? Zarządzasz zespołem lub firmą i chcesz zwiększyć obecność w Internecie i poprawić wyniki marketingowe? Jeśli tak - nasze Szkolenie AI dla marketerów w praktyce jest w sam raz dla Ciebie!

Jan Wojciechowski

Content Marketing Specialist


Specjalista Content Marketingowy z kilkuletnim doświadczeniem. Studiował Zarządzanie i Marketing na Uniwersytecie Warszawskim. W swojej pracy łączy lekkie pióro, wiedzę contentową i zamiłowanie do nowych technologii. Prywatnie miłośnik sportu, literatury oraz ilustrator książek.
Szkolenia
Polski