- IBM Cloud vključuje pospeševalnik Gaudi 3 Intel, na voljo v Frankfurtu in Washingtonu, z načrti za Dallas.
- Ponuja konkurenčno zmogljivost v primerjavi z grafičnimi procesorji ... NVIDIA H100 in H200, po nižji ceni.
- Na voljo je več možnosti uvajanja: namenski strežniki, kontejnerska vozlišča in licencirana vozlišča Watsonx.
- Vključuje varnost, ki temelji na strojna oprema in podporo ekosistemov Red Hat in Wipro.
IBM Cloud je uradno napovedal dodajanje pospeševalnikov umetna inteligenca Intel Gaudi 3 v svojo infrastrukturo, kar podjetjem zagotavlja izvedljivo in stroškovno učinkovito alternativo tradicionalnim grafičnim procesorjem NVIDIA. To sodelovanje označuje novo poglavje v boju za prevlado na trgu umetne inteligence v oblaku v kontekstu, kjer povpraševanje po zmogljivih in ekonomičnih rešitvah še naprej narašča.
Pospeševalniki Gaudi 3 so zdaj na voljo v regijah IBM Cloud v Frankfurtu (eu-de) in Washington DC (ameriški vzhod), v Dallas (ameriški jug) pa naj bi prispeli v drugem četrtletju 2025. Ta razširitev se odziva na vse večjo potrebo po razširljivosti delovnih obremenitev generativni AI, ki globalnim organizacijam ponuja večjo geografsko prilagodljivost.
Stroškovno učinkovita alternativa in konkurenčna zmogljivost
Ena od glavnih zanimivosti Gaudija 3 v IBM Cloud je njegova privlačna cena v primerjavi z grafičnima procesorjema NVIDIA H100 in H200, brez ogrožanja zmogljivosti. Različni testi, ki jih je izvedel Signal65, so pokazali, da je Gaudi 3 prekašal grafične procesorje NVIDIA v določenih scenarijih z uporabo jezikovnih modelov, kot sta IBM-ov Granite (8B) in Metin Llama-3.1. Čeprav se rezultati razlikujejo glede na vrsto naloge, začetni podatki so spodbudni.
Intel trdi, da Gaudi 3 zagotavlja a 50 % večja zmogljivost sklepanja in 40 % večja energetska učinkovitost v primerjavi s H100. Poleg tega njegova arhitektura omogoča boljše skaliranje nalog globokega učenja prek programabilnih tenzorskih jeder, specializiranih mehanizmov za množenje matrik in pomembnega pasovna širina pomnilnika.
Čip je izdelan v 5nm procesu in vključuje 24 hitrih Ethernet vrat, ki omogoča hitro povezljivost med vozlišči IA. Prav tako je optimiziran za okolja, ki uporabljajo ogrodja, kot je PyTorch, in modeli, vgrajeni v Hugging Face, s čimer krepijo podpora razvijalcem in podatkovnim znanstvenikom.
Raznolikost možnosti uvajanja
IBM je zasnoval več načinov za namestitev pospeševalnika Gaudi 3 v vaš oblak in se prilagajal različne poslovne potrebe. Razpoložljive možnosti vključujejo:
- Namenski strežnik v IBM Cloud VPC: idealno za tiste, ki potrebujejo zasebno in varno okolje s popolnim nadzorom nad programsko opremo, vključno s podporo za Slike Red Hat Enterprise Linux osredotočen na AI.
- Delovno vozlišče v vsebniku: Z začetkom v drugem četrtletju 2025 bo IBM ponudil upravljana vozlišča Gaudi 3 za gruče Red Hat OpenShift AI, kar bo olajšalo integracijo v zabojniška izvorna okolja.
- Licenca po meri z watsonx: Stranke, ki že imajo licence watsonx.ai, jih bodo lahko uporabljale s strojno opremo Gaudi 3 in s tem ohranile svoje prilagojeno verigo orodij in poteke dela.
- Razmestitvene arhitekture (DA): Vnaprej konfigurirani moduli za pospešitev sprejemanja brez potrebe po prevelikem ročnem posredovanju, na voljo v drugi polovici leta 2025.
Ti arhitekturi bosta na voljo za oba virtualni strežniki okolja VPC in za rešitve, ki temeljijo na watsonx in OpenShift v IBM Cloud.
Ekosistemska podpora: Red Hat in Wipro
Red Hat in Wipro sta se pridružila tej pobudi. Medtem ko Red Hat poudarja svoje zavezanost odprtokodnosti in skupnega razvoja Wipro poudarja integracijo Gaudija 3 v svoj center odličnosti za generativno umetno inteligenco in svoje prejšnje sodelovanje z IBM. Čeprav oba partnerja ne dajeta globokih tehničnih podrobnosti, njuna podpora daje moč skupni uporabi.
Varna in storilnostno usmerjena infrastruktura
Na področju, kjer je zaščita občutljivih podatkov kritična, je IBM integriral Intel TDX (Trust Domain Extensions) v svoje virtualne strežnike VPC. Ta tehnologija omogoča obdelavo zaupno s pomočjo strojne opreme, ki zagotavlja izolacija in zasebnost na ravni virtualnega strežnika. Ta lastnost je še posebej pomembna pri regulirane industrije, kot so zdravstveni ali finančni.
Interoperabilnost med Intel Gaudi 3 in IBM Cloud prispeva k zmanjšati obratovalne stroške z zagotavljanjem razširljivega, vsestranskega in varnega okolja. Po besedah predstavnikov obeh podjetij želi sodelovanje narediti umetno inteligenco podjetij bolj dostopno in pospešiti njeno globalno sprejetje.
Dolgoročni strateški pristop
To zavezništvo med Intelom in IBM-om je del strategije več ponudnikov, katere cilj je diverzifikacija ponudbe pospeševalnikov umetne inteligence. Čeprav je lahko začetna integracija omejena v smislu razširjene podpore ali razvojnega ekosistema v primerjavi z vodilnimi na trgu, je to realna možnost za podjetja, ki želijo prekiniti odvisnost od NVIDIA.
Razpoložljivost več poti uvedbe, skupaj s prednostmi pri stroških in porabi energije, povečuje privlačnost Gaudija 3 kot alternative za Delovne obremenitve AI tako v testiranju kot v proizvodnji. Dolgoročni uspeh bo v veliki meri odvisen od sprejem na trgu in stopnjo integracije z obstoječimi orodji.
Uvedba Intel Gaudi 3 v IBM Cloud je strateška poteza, ki bi lahko spremenila dinamiko trga pospeševalnikov umetne inteligence v oblaku. Zaradi številnih načinov izvajanja, konkurenčne zmogljivosti v primerjavi z bolj priljubljenimi možnostmi in nižjih stroškov je predstavljen kot privlačna možnost za tiste organizacije, ki iščejo učinkovitost ne da bi opustili nadzor. Sodelovanje ključnih akterjev v ekosistemu in vključevanje varnostnih tehnologij krepita njegovo pozicijo kot trdne alternative v infrastrukturah umetne inteligence.
Strasten pisec o svetu bajtov in tehnologije nasploh. Rad delim svoje znanje s pisanjem in to je tisto, kar bom počel v tem blogu, saj vam bom pokazal vse najbolj zanimive stvari o pripomočkih, programski opremi, strojni opremi, tehnoloških trendih in še več. Moj cilj je, da vam pomagam krmariti po digitalnem svetu na preprost in zabaven način.