DeepSeek V3-0324: AI chinezesc lansează o nouă competiție tehnologică

Ultima actualizare: 27/03/2025
Autorul: Isaac
  • DeepSeek-V3-0324 introduce îmbunătățiri semnificative în de programare, raționament matematic și generare de cod.
  • China continuă să avanseze în acest sector inteligența artificială, reducând decalajul față de Statele Unite.
  • Noul model îl depășește pe predecesorul său în teste cheie precum MMLU-Pro, AIME 2024 și LiveCodeBench.
  • Este disponibil sub licența MIT, care permite utilizarea comercială nerestricționată.

Modelul DeepSeek-V3-0324 AI

DeepSeek, compania chineză de inteligență artificială, a lansat o nouă versiune a modelului său lingvistic, numită DeepSeek-V3-0324. Această actualizare aduce îmbunătățiri substanțiale în de programare, prelucrarea matematică y generarea codului, precum și o abordare a competiției de China în cursa pentru inteligența artificială, realizând progrese care o apropie și mai mult de concurenții săi occidentali.

Acest nou model nu numai că își perfecționează capacitățile de înțelegere a limbajului, dar și-a îmbunătățit și raționamentul și acuratețea la diferite teste de referință. Aceste progrese l-au determinat să devină unul dintre cele mai populare modele pe platforme precum Fata îmbrățișată, unde este disponibil pentru dezvoltatori și cercetători.

Un salt în precizie și performanță cu DeepSeek-V3-0324

DeepSeek a lucrat la îmbunătățirea modelului său anterior V3, obținând o precizie mai mare în testele cheie cu actualizarea V3-0324. În criteriu MMLU-Pro, un etalon în evaluarea modelelor lingvistice, a trecut de la 75,9% la 81,2%, ceea ce reprezintă o diferență notabilă în capacitatea răspunsului a sistemului. Această descoperire evidențiază importanța modelelor deschise în peisajul inteligenței artificiale de astăzi.

Alte progrese notabile includ performanța lor la evaluarea la matematică ȚINTĂ 2024, unde s-a îmbunătățit de la 39,6% la 59,4%. Aceasta reprezintă o creștere de aproape 20%, o îmbunătățire semnificativă în ceea ce privește precizia la această disciplină. În test LiveCodeBench, care măsoară capacitatea unui model de a genera cod funcțional, noul model a crescut cu zece puncte până la 49,2%.

  Ce este Microsoft Agent 365 și la ce se folosește în afaceri?

DeepSeek-V3-0324 îmbunătățește programarea și performanța

Optimizare în generarea de cod și performanță în AI

Modelul V3-0324 introduce îmbunătățiri în apel de funcție, care rezolvă mai multe probleme ale versiunilor anterioare în ceea ce privește acuratețea. Acest lucru se traduce în mai mare fiabilitate în dezvoltarea de software și aplicații automatizate, facilitând munca de programatori y dezvoltatorii. Această descoperire este crucială în contextul generării cod curat.

În plus, actualizarea permite creați interfețe web mai atractive și îmbunătățiți estetica front-end-urilor jocurilor. Un alt aspect relevant este capacitatea sa optimizată pentru rescriere interactivă cu mai multe ture, un progres cheie pentru îmbunătățirea calității răspunsurilor în asistenți virtuali y chatbots.

De la lansare, diverși specialiști au testat performanța modelului și au raportat că viteza de execuție atinge mai mult de 20 de jetoane pe secundă în sisteme precum Mac Studio cu cip M3, care îi întărește eficiența operațională.

agenti copilot de securitate-1
Articol asociat:
Microsoft extinde Security Copilot cu agenți AI pentru a îmbunătăți securitatea cibernetică

DeepSeek-V3-0324 și strategia de inteligență artificială a Chinei

Lansarea modelului face parte din a strategie mai amplă din China pentru a-și consolida poziția de lider în inteligența artificială și pentru a reduce decalajul cu companiile occidentale precum OpenAI și antropică. Una dintre cheile acestei creșteri constă în optimizarea resurselor: DeepSeek a reușit să concureze la un nivel înalt cu o utilizare mai redusă a plăci grafice și costuri de calcul mai mici, lucru care a atras atenția experților din industrie.

Modelul este disponibil sub Licență MIT, permițându-i utilizarea fără restricții comerciale, crescându-i astfel accesibilitatea și potențialul de adoptare în diferite industrii. Acest lucru îl diferențiază de modelele închise precum GPT-4.5, oferind o alternativă puternică și deschisă pentru dezvoltatorii y companii de tehnologie. Această deschidere este fundamentală în evoluția IA în regiunea.

DeepSeek-V3-0324 îmbunătățește inteligența artificială

Un model în continuă evoluție

Deși progresul înregistrat cu DeepSeek-V3-0324 este semnificativ, compania încă lucrează la îmbunătățirea sistemului. Se zvonește că o nouă versiune, eventual numită DeepSeek R2, ar putea fi lansat in lunile urmatoare, ceea ce ar demonstra o evolutie constanta a capacitatilor sale.

  GlobalGPT: Ce este acest AI all-in-one și cum funcționează?

Experții în inteligență artificială au subliniat că acest model a obținut o precizie mai mare în scrierea de texte lungi și lungime medie, în plus față de îmbunătățiri ale calitatea traducerii y redactare. Stăpânirea lui asupra limba chineza De asemenea, a fost optimizat, aliniindu-se stilului modelului R1, o altă dintre cele mai notabile dezvoltări ale companiei.

Avansarea DeepSeek reprezintă o provocare pentru companiile occidentale, care vor trebui să continue să inoveze pentru a-și menține liderul în sector. Cu capacitatea sa de a genera cod de calitate şi optimizarea ei în raţionament matematic, acest model este poziționat ca un instrument cheie în viitorul inteligenței artificiale.

Baidu lansează Ernie 4.5 și Ernie X1-0
Articol asociat:
Baidu dezvăluie Ernie 4.5 și Ernie X1 pentru a-și consolida liderul AI

Dezvoltarea acestor tipuri de modele se înscrie și într-un context geopolitic de mare competiție tehnologică. În timp ce Statele Unite mențin restricții la exportul de hardware avansat față de China, companiile chineze continuă să găsească modalități de a avansa și de a concura în sector. Această lansare nu marchează doar o îmbunătățire în ceea ce privește tehnologia, ci răspunde și la a nevoie strategică de autonomie în inteligența artificială.

Evoluția continuă a DeepSeek demonstrează că China face progrese semnificative în dezvoltarea modelelor AI deschise și competitive. Cu fiecare iterație, decalajul cu Occidentul se micșorează, ceea ce prefigurează o concurență și mai intensă în următorii ani.

tsmc nu va face cipuri AI avansate pentru china-0
Articol asociat:
TSMC nu va produce cipuri AI avansate pentru China din cauza restricțiilor impuse de SUA