- V3.2-Exp wuxuu bilaabay DSA: Fiiro gaar ah oo aan fiicneyn oo loogu talagalay macnaha guud.
- Waxqabadka la barbar dhigi karo V3.1-Terminus iyo 50% kharashyada API ka hooseeya.
- Laga heli karo abka, shabakadda, iyo API; Shatiga MIT iyo kernels furan.
- Taageerada maalinta-0 ee vLLM iyo diritaan sahlan oo leh SGLang iyo Wajiga Hugging.
Xili ay Generative AI nasasho ma siiyo, DeepSeek ayaa ku dhaqaaqay tallaabo toos ah oo ujeeddadeedu tahay hufnaanta iyo macnaha dheer. DeepSeek-V3.2-Exp Waa nooc tijaabo ah oo doonaya in uu ansixiyo isbeddelka la taaban karo ee wax-soo-saarka: dareen cusub oo kala firdhiyey kaas oo ballan-qaaday in uu dardargelinayo tababarka iyo soo-jeedinta iyada oo aan tayada wax-soo-saarka ka sii xumaanayn.
Qaabka cusubi kama soo bilaabo eber; waxay ku tiirsan tahay V3.1-Terminus, laakiin waxay soo bandhigaysaa hab muhiim ah oo loo yaqaan DeepSeek Sparse Attention (DSA)DSA, DeepSeek waxay sheeganeysaa inay dhimeyso kharashaadka xisaabinta iyo, howsha, hoos u dhig qiimaha API in ka badan 50% oo leh saameyn degdeg ah, iyada oo la ilaalinayo waxqabad la mid ah kii ka horreeyay ee hawlo badan.
Waa maxay DeepSeek-V3.2-Exp iyo sababta ay muhiim u tahay
DeepSeek waxay ku qeexday V3.2-Exp inay tahay tallaabo dhex dhexaad ah oo loo maro qaabdhismeedkeeda soo socda, jaranjaro loogu talagalay in lagu tijaabiyo oo lagu muujiyo hufnaan gaar ah xaaladaha macnaha guudSida laga soo xigtay shirkadu, ujeedadu waa in la dardargeliyo tababarka iyo ka-fiirsashada labadaba marka la qabanayo taxane badan oo qoraal ah, halkaas oo transformers-dhaqameedka inta badan ay sare u kacaan qiimaha.
Furaha ayaa ah in siideyntan ay tahay tijaabin, laakiin ma aha sababtaas sabab la yaab leh: waxay gaadhaysaa app, webka iyo API DeepSeek laga bilaabo maalinta koowaad, furitaanka albaabka horumariyeyaasha, kooxaha xogta, iyo cilmi-baarayaasha si ay ugu tijaabiyaan kiisaska dhabta ah ee adduunka oo leh tiro badan oo macne ah.
Farsamo ahaan, V3.2-Exp waxay dhaxashaa aasaaska V3.1-Terminus si loo ilaaliyo tayada loona fududeeyo is barbar dhig cadaalad ah. DeepSeek waxay tusinaysaa inay si ula kac ah ula jaanqaadday qaabaynta tababarka Terminus si loo cabbiro saamaynta dhabta ah ee DSA, iyo halbeegyada gudaha u muuji natiijooyinka la siman raadinta, barnaamijka iyo xisaabta.
Marka laga soo tago tirooyinka, macnaha guud ee suuqa ayaa ah: ku dhawaaqida X waxay muujineysaa in hadda la heli karo iyo in dhimista qiimaha API ay ka badan tahay 50%. Warku waa cad yahayHaddii hufnaantu soo roonaato, kharashyadu hoos u dhacaan, taasina waxay cadaadis saaraysaa xafiiltanka Shiinaha iyo dibedda, sida Alibaba's Qwen ama xulashooyinka Mareykanka.
Maxay DeepSeek Sparse Attention (DSA) soo bandhigaysaa
DSA waa habka fiiro gaar ah oo kala firirsan Diirada saaray daaqadaha macnaha guud. Halkii dhammaan calaamadaha si isku mid ah loola dhaqmi lahaa, waxay mudnaanta siineysaa jajabyada dhabta ah ee khuseeya waxayna yareysaa shaqada aan loo baahnayn, iyadoo la ilaalinayo tayada wax soo saarka ee isku midka ah.
Si taas loo gaaro, DeepSeek waxay ku daraysaa qayb la yiraahdo Tilmaamaha hillaaca, kuwaas oo shaqadoodu ay tahay in ay ku meeleeyaan mudnaanta meelaha gaarka ah ee daaqada macnaha guud. Talaabadani waxay ka horraysa dareenka waxayna u shaqaysaa sidii shaandhayn caqli leh oo kala saarta lama huraanka iyo heerka labaad.
Ka bacdi baadhistan kowaad, qaabku waxa uu dabaqayaa habraaca xulashada calaamad wanaagsanFicil ahaan, tani waxay ka dhigan tahay in dhammaan calaamaduhu aysan u tartamin dareenka: kaliya kuwa loo aqoonsaday inay yihiin macluumaadka ugu badan ayaa u guura daaqadda dareenka yar, taas oo yaraynaysa isticmaalka xusuusta iyo xisaabinta.
Saamaynta dhinaca togan waa in nidaamku tixgelin karo qaybo badan oo macnaha guud ah isla markaana joogteeyaan khadadka badan ee sababaynta isku mar, adoon niyad jabin. Tani waxay si gaar ah faa'iido u leedahay socodka dheer, falanqaynta dukumeentiyada adag, ama ballaaran, wada sheekaysiga xarkaha badan.
Sida ay u shaqeyso: Tilmaanta Hillaaca iyo Xulashada Token
Dhuumaha fikradda ah ee qeexaya DeepSeek waxaa loo fududayn karaa dhowr weji oo isku xiran, mid walbana wuxuu leeyahay door gaar ah si loo kordhiyo waxtarka marka la eego xaaladaha dheer. Hagaajinta waxay ku saabsan tahay doorashada si ka wanaagsan, ee ma aha habayn badan..
- Mudnaanta degdega ah: The Tilmaamaha hillaaca Waxay sawirtaa daaqada waxayna muujisaa jajabyada musharaxiinta ee leh macnaha sare ama qaabdhismeedka.
- Sifeynta Fine: The xulashada calaamad wanaagsan, kaas oo qeexaya calaamadaha dhabta ah ee soo galaya diiradda dareenka kala firdhiyey.
- Daryeelka hufan: the DSA waxay khusaysaa dareenka kaliya ee la doortay, kaydinta xisaabinta iyo xusuusta marka loo eego dareenka cufan ee soo jireenka ah.
- Wax-soo-saarka la barbar-dhigi karo: Tayada moodeelka waxaa lagu hayaa ficil ahaan, iyadoo lagu saleynayo cabbirrada gudaha ee V3.1-Terminus.
DeepSeek waxa ay ku nuuxnuuxsatay in istaraatiijiyadani aanay ahayn khiyaano hal mar ah: ulajeedadu waa ansixiyo oo la dhiso horumar wax ku oolnimada dhismahaaga mustaqbalka. Si kale haddii loo dhigo, V3.2-Exp waa goob tijaabo ah oo dhab ah, laakiin horayba loo isticmaali karo wax soo saarka.
Intaa waxaa dheer, shirkadu waxay xustay in habka uu u ogolaado qaabka si toos ah u ansixi xuduudaha qaarkood inta lagu guda jiro tababarka xaaladaha muddada-dheer, si firfircoon u habaynta dadaalka xisaabinta waxa dhab ahaantii gacan ka geysanaya macluumaadka.
Waxqabadka, bartilmaameedyada iyo qiimaha: 50% ka yar API-ga
Mid ka mid ah gabagabada ugu xiisaha badan ayaa ah in waxqabadka V3.2-Exp Waxay la siman tahay V3.1-Terminus meelaha muhiimka ah: mashiinka raadinta ahaan, hawlaha codaynta, iyo dhibaatooyinka xisaabta. Joogitaanka natiijooyin isku mid ah oo leh xisaabin yar ayaa awood u siinaysa hoos u dhaca qiimaha.
DeepSeek ayaa ku dhawaaqday in Qiimaha API ayaa hoos u dhacay in ka badan 50% isla markiiba waad ku mahadsan tahay hufnaanta laga gaaray DSA. Go'aankani ma fududa oo kaliya helitaanka tignoolajiyada, laakiin sidoo kale wuxuu ka dhigayaa isbarbardhigga mid qaali ah tartamayaasha kuwaas oo ay tahay inay caddeeyaan kharashyada isticmaalka sare.
Marka la eego waayo-aragnimada wax ku oolka ah, horumarinta ayaa si gaar ah loogu arki karaa xaaladaha macnaha guud: Falanqaynta xogta ballaaran, habaynta dukumeenti sharci ama farsamo, hababka dib-u-noqoshada oo leh taariikh dheer, iyo dhuumo kasta oo ku tiirsan taxanaha qoraalka aadka u dheer.
Mala-awaalka DeepSeek waa caddahay: haddii qaabku awoodo ka qayb gal si doorasho ah kuwa khuseeya, ururku wuxuu xamili karaa shaqo badan oo leh kaabayaasha isku midka ah, ama culeys isku mid ah oo leh kharash yar, iyada oo aan lumin isku halaynta meesha laga baxo.
Helitaanka, il furan iyo shatiga
V3.2-Exp ayaa laga heli karaa goobta codsiga, nooca webka iyo API-ga DeepSeek. Qaabka ayaa si furan loogu daabacay qof kasta si uu u qiimeeyo, waxaana la socda shati MIT ee kaydka iyo miisaanka, taas oo door biday cilmi-baarista iyo korsashada ganacsiga.
Furfurnaantani waxay ka soo horjeedaa habab badan oo xiran, iyo waxay dimuqraadiyaysaa gelitaanka awoodaha horumarsan. Waxay sidoo kale xoojinaysaa doorka Shiinaha ee tartanka loogu jiro IA iyada oo loo fududeynayo jaamacadaha, kuwa bilawga ah, iyo shirkadaha maxaliga ah iyo kuwa caalamiga ah inay ka faa'iidaystaan oo ay wax ka beddelaan xirmooyinka.
Shirkaddu waxay xoogga saartaa dabeecadda tijaabin laga bilaabo sii daynta: Waxay u adeegtaa sidii horudhac ah waxa ku iman kara qaab dhismeedka jiilka soo socda. Weli, siideynteeda xasilloon ee dhammaan saddexda kanaal ee waaweyn waxay muujineysaa heerka qaan-gaarnimada ee ku filan isticmaalka adduunka dhabta ah.
Xidhiidhada tixraaca: kaydka iyo dukumeentiga farsamada ee GitHub, moodelka on Wajiga isku duuban iyo xiriirka taageerada at service@deepseek.com. Xidhmada oo dhan waxay doonaysaa inay fududayso korsashada by bulshada.
Hagaha degdega ah si aad ugu socodsiiso gudaha
DeepSeek waxa ay bixisa muujinta la cusboonaysiiyay ee looga dan leeyahay in lagu dadajiyo kabaha oo u oggolow bulshada inay fahmaan dhismaha. Qulqulka leh Wajiga Hugging iyo beddelka miisaanka waa mid toos ah. oo tixgeli isbarbardhigga moodeelka ku salaysan GPU-yadaada.
cd inference
export EXPERTS=256
python convert.py --hf-ckpt-path ${HF_CKPT_PATH} --save-path ${SAVE_PATH} --n-experts ${EXPERTS} --model-parallel ${MP}
export CONFIG=config_671B_v3.2.json
torchrun --nproc-per-node ${MP} generate.py --ckpt-path ${SAVE_PATH} --config ${CONFIG} --interactive
Kuwa doorbidaya inay u adeegaan moodalka SGLang, waxaa jira sawirro Docker oo diyaarsan oo loogu talagalay qaab dhismeedka kala duwan. Calaamaduhu waxay daboolayaan NVIDIA GPU, ROCm iyo NPUs, oo ay ku jiraan noocyo gaar ah.
# H200
docker pull lmsysorg/sglang:dsv32
# MI350 (ROCm)
docker pull lmsysorg/sglang:dsv32-rocm
# NPUs
docker pull lmsysorg/sglang:dsv32-a2
docker pull lmsysorg/sglang:dsv32-a3
# Lanzar servidor
python -m sglang.launch_server --model deepseek-ai/DeepSeek-V3.2-Exp --tp 8 --dp 8 --page-size 64
Haddii aad isticmaasho vLLM, mashruuca ayaa ku dhawaaqaya maalin-0 taageero ee V3.2-Exp. U fiirso cuntooyinka rasmiga ah ee tafaasiisha cusub ee qaabaynta, bogga KV, iyo cabirrada waxqabadka.
Xaaladaha oo dhan, waxaa lagu talinayaa in la hagaajiyo MP tirada GPU-yada la heli karo lana socdaan isticmaalka xusuusta dhabta ah. Tani waxay gaadhaysaa dheelitirka ugu wanagsan ee u dhexeeya daahitaanka, wax soo saarka, iyo kharashka codsi kasta.
Kernels furan iyo taageerada nidaamka deegaanka
DeepSeek waxay soo saartay qaybo badan oo sahlaya cilmi-baarista iyo wax-soo-saarka. Kuwa mudnaanta siiya akhrinta iyo naqshadaynta ujeedooyinka cilmi-baarista, waxaa lagula talinayaa TileLang sida bilowga.
Waxqabadka saafiga ah ee CUDA, kernels logit indexer (oo ay ku jiraan noocyada paginated) ayaa laga heli karaa at DeepGEMM. Dhankooda, kernels dareenka firidhsan ayaa lagu daabacay FlashMLA, loogu talagalay in lagu kordhiyo waxtarka GPU-yada casriga ah.
Habkan qaab-dhismeedka ah wuxuu u oggolaanayaa qaybaha in la isku daro haddii loo baahdo: akhrin u samaynta prototying iyo waxbaridda, ama kernels waxqabadka sare si loo dalbado go'aan ka hooseeya culeysyada dhabta ah ee adduunka. Waa waxa kaliya ee aad u baahan tahay si aad uga guurto tijaabada una guurto wax soo saar adoon dib u shaqaynayn dhammaan dhuumaha.
Intaa waxaa dheer, daabacaadda kernels-yadan iyadoo xoogga la saarayo macnaha guud ee dheer ayaa buuxinaya riixitaanka DSA, oo xiraya wareegga u dhexeeya cilmi baaris la dabaqay, bartilmaameedka iyo geynta dhabta ah.
Saamaynta istiraatijiyadeed iyo waxa soo socda
In qaabka tijaabada ahi uu ku gaadho App, Web iyo API qiimo dhimis degdeg ah Waa hadal ujeeddo. DeepSeek kaliya kuma sahamiso safka cilmi baarista; waxay u turjumaysaa badeecad waxayna u gudbisaa kaydadka isticmaalaha ugu dambeeya.
Talaabadan ayaa cadaadis ku kordhinaysa tartamayaasha nidaamka deegaanka ee Shiinaha, sida Qwen ee Alibaba, horeyba dhigooda Mareykanka. Haddii waxqabadku uu ku sii jiro heerka beddelka qaaliga ah, qodobka qiimuhu wuxuu tilmaami karaa dheelitirka waaxaha xasaasiga ah.
Kala soocida kale waa saamayn il furanShatiyada la oggol yahay, kernels dadweynaha, iyo taageerada ballaaran waxay dardargeliyaan korsashada waxayna fududeeyaan xisaabinta, barashada, iyo wax ku biirinta. Tani waxay ka duwan tahay moodooyinka xiran waxayna albaabada u furaysaa SME-yada iyo shaybaadhka jaamacadda inay ku boodaan bandwagon.
Heer sheeko ahaan, waxaa xiiso leh sida DeepSeek u qaabeeyo V3.2-Exp sida aragti mustaqbalkaHababka fiiro gaar ah oo kala firidhsan ayaa la ansaxiyay, saameyntoodana waa la barbardhigayaa, iyada oo dhammaan qodobada kale ay si joogto ah u hayaan. Cadaadiskan isbarbardhigga ah wuxuu siinayaa kalsoonida natiijooyinka.
Xagasha ee khadadka badan ee fikirka isku marAwood u yeelashada in la sii wado silsilado badan oo caqli-gal ah iyada oo aan la kordhin qiimaha waxay furto fursadaha wakiilada kakan, sababo badan oo tallaabooyin ah, iyo nidaamyo isku dara raadinta, isku-dhafka, iyo xaqiijinta.
Tixraacyo, xigasho iyo xiriir
Kuwa raba inay sii qoto dheeraan, DeepSeek waxay ku xidhaa moodeel ku yaal Wajiga Hugging Warbixin farsamo ayaa horeba looga helay GitHub. Waxa kale oo ay la wadaagtaa baloog xigasho oo ah qaabka BibTeX iyo ciwaanka iimaylka ee taageerada iyo su'aalaha.
@misc{deepseekai2024deepseekv32,
title={DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention},
author={DeepSeek-AI},
year={2025}
}
Kanaalka shirkadda ee X ayaa soo koobay ku dhawaaqista: soo bandhigida DeepSeek-V3.2-Exp, Helitaanka App, Web iyo API, oo leh hoos u dhac qiimo API ah oo ka badan 50%. Diiradadu waxay ku soo noqotay macnaha guud iyo dhamaadka-ilaa-dhamaadka waxtarka.
Isku soo wada duuboo, warbaahinta teknoolajiyada ayaa soo bandhigtay bilawga, iyada oo u dhigtay dhaqdhaqaaq ku habboon ka dib saameynta V3 iyo R1, oo tilmaamaysa in, haddii ay xoojinayso ballanqaadkeeda, kordhin doona tartanka marka la eego qiimaha tayada marka la barbar dhigo ciyaartoyda waaweyn ee qaybta.
Si loo xiro goobada, waxaa habboon in la xasuusto wakhtiga dhow: laga bilaabo qaadista Kala hadalGPT in 2022 Generative AI waxa uu ku horumaray xawli aan hore loo arag ilaa maanta. V3.2-Exp waxay ku habboon tahay isbeddelkaas: macnaha guud, kharash yar, iyo naqshad wax ka barata tijaabooyinkeeda.
V3.2-Exp waxay u taagan tahay ikhtiyaarka ah in la tixgeliyo mashaariicda u baahan xaaladaha waaweyn, xawaaraha iyo xakamaynta qiimahaHabka fiiro gaar ah leh, habka fiiro gaar ah, taageerada nidaamka deegaanka (vLLM, SGLang, kernels furan), iyo shatiga MIT ayaa si gaar ah u soo jiidanaya labadaba cilmi-baarista la dabaqay iyo geynta ganacsiga halkaas oo millise seconds kasta iyo euro kasta lagu tiriyo.
Qora xamaasad leh oo ku saabsan adduunka bytes iyo farsamada guud ahaan. Waxaan jeclahay inaan aqoontayda ku wadaago qoraal, taasina waa waxa aan ku samayn doono blog-gan, ku tusi doona dhammaan waxyaabaha ugu xiisaha badan ee ku saabsan qalabka, software-ka, qalabka, isbeddellada tignoolajiyada, iyo in ka badan. Hadafkaygu waa inaan kaa caawiyo inaad u dhex marato adduunka dhijitaalka ah si fudud oo madadaalo leh.