- DeepSeek R2 obiecuje nawet o 97% niższe koszty przetwarzania w porównaniu do GPT-4o.
- Model wykorzystuje 1.200 miliarda parametrów i został wytrenowany na 5,2 petabajtach danych.
- 82% chipów używanych podczas treningu to Huawei Wzniesienie się, zmniejszenie zależności od NVIDIA.
- Jego wydajność i cena mogą uczynić go poważnym konkurentem w skali globalnej.

Sektor sztuczna inteligencja przeżywa prawdziwy wyścig technologiczny, w którym duże firmy walczą o uzyskanie wydajniejszych i mocniejszych modeli. DeepSeek, chińska firma, wkroczyła na scenę ze swoim kolejnym wydawnictwem: Głębokie wyszukiwanie R2, który według wyciekłych danych może zmienić zasady gry, oferując IA duża wydajność przy znacznie niższych kosztach niż w przypadku większości bezpośrednich konkurentów.
Wiadomość rozprzestrzeniła się lotem błyskawicy w sektorze technologicznym, ponieważ DeepSeek R2 ma stać się realną i niedrogą alternatywą dla gigantów, takich jak ChatGPT, Google Gemini lub Meta Llama. Chęć bezpośredniej rywalizacji opiera się na przekonującym argumencie: Koszt przetwarzania dużych ilości informacji będzie, według szacunków, znacznie niższy od kosztów najnowocześniejszych obecnie modeli.
DeepSeek R2 Funkcje techniczne
DeepSeek R2 jest prezentowany jako model sztucznej inteligencji generatywnej o otwartym kodzie źródłowym, umożliwiając zarówno firmom, jak i indywidualnym programistom badanie, dostosowywanie i adaptowanie technologii do swoich potrzeb. Jego nowa wersja wdraża 1,2 biliona parametrów, podnosząc tym samym poprzeczkę w porównaniu do swojego poprzednika i zbliżając się do wydajności najbardziej zaawansowanych opcji na rynku.
Model został wytrenowany przy pomocy 5,2 petabajtów danych, Większość z nich pochodzi z zestawu C-Eval 2.0, co podkreśla skalę wykonanej pracy. Pod względem możliwości oczekuje się, że wydajność komputerowego widzenia osiągnie znakomite wyniki, osiągając dokładność do 92,4% w testach z systemem COCO.
Koszt użytkowania jest jedną z jego najważniejszych zalet. Według przecieków, korzystanie z DeepSeek R2 będzie kosztować zaledwie 0,07 USD za milion tokenów wejściowych i 0,27 USD za milion tokenów wyjściowych, co oznacza redukcję kosztów o prawie 97% w porównaniu z GPT-4.
Niezależność technologiczna dzięki chipom Huawei Ascend
Jedną z najważniejszych zmian w rozwoju DeepSeek R2 jest zaangażowanie w sprzęt komputerowy krajowy 82% chipów użytych w trakcie szkolenia pochodziło z serii Huawei Ascend 910B, co wyraźnie odchodzi od powszechnego dotychczas w branży wykorzystania procesorów graficznych NVIDIA. Decyzja ta wiąże się nie tylko drastyczne obniżenie kosztów energii i produkcji, ale także większą suwerenność technologiczną, zwłaszcza na rynku chińskim.
Zwrot w stronę rozwiązań lokalnych pozwala firmie DeepSeek nadal rozwijać się niezależnie i zmniejszać zależność od amerykańskiego łańcucha dostaw, co może zwiastować zmianę w przyszłym rozwoju sztucznej inteligencji zarówno w Chinach, jak i na innych wschodzących rynkach.
Globalny konkurent dla tytanów sztucznej inteligencji
W środowisku, w którym innowacja jest stała, DeepSeek R2 wyłania się jako rywal, który może wywrzeć presję na popularne modele, takie jak GPT-4 Turbo czy Google Gemini 2.0 Pro, ze względu na stosunek ceny do wydajności. Nacisk na wydajność i skalowalność, w połączeniu z filozofią open source, czyni ją atrakcyjną zarówno dla przedsiębiorstw, jak i niezależnych programistów, którzy szukają bardziej ekonomicznych alternatyw bez utraty wydajności.
Na razie większość dostępnych szczegółów pochodzi z przecieków i analiz ekspertów w dziedzinie sztucznej inteligencji. Na oficjalne potwierdzenie ze strony firmy będziemy musieli poczekać. Jednakże oczekiwania generowane przez ten nowy model są niezaprzeczalne i stanowią punkt zwrotny w trendzie kosztowym generatywnej sztucznej inteligencji.
W dziedzinie sztucznej inteligencji utrzymuje się tendencja do wzrostu konkurencji, co napędza postęp demokratyzujący dostęp do tych technologii. DeepSeek R2 stanowi znaczący krok w poszukiwaniu bardziej dostępnych i zrównoważonych rozwiązań, zdolny do demokratyzacji dostępu do zaawansowanej sztucznej inteligencji zarówno w Azji, jak i poza nią.
Pisarz z pasją zajmujący się światem bajtów i technologii w ogóle. Uwielbiam dzielić się swoją wiedzą poprzez pisanie i właśnie to będę robić na tym blogu, pokazywać Ci wszystkie najciekawsze rzeczy o gadżetach, oprogramowaniu, sprzęcie, trendach technologicznych i nie tylko. Moim celem jest pomóc Ci poruszać się po cyfrowym świecie w prosty i zabawny sposób.

