- IBM Cloud intègre l'accélérateur Gaudi 3 Intel, disponible à Francfort et à Washington DC, avec des projets pour Dallas.
- Il offre des performances compétitives par rapport aux GPU de NVIDIA H100 et H200, à moindre coût.
- Plusieurs options de déploiement disponibles : serveurs dédiés, nœuds conteneurisés et nœuds sous licence Watsonx.
- Inclut la sécurité basée sur matériel et le soutien de l'écosystème Red Hat et Wipro.

IBM Cloud a officiellement annoncé l'ajout des accélérateurs de intelligence artificielle Intel Gaudi 3 à son infrastructure, offrant aux entreprises une alternative viable et rentable aux GPU NVIDIA traditionnels. Cette collaboration marque un nouveau chapitre dans la lutte pour dominer le marché de l’intelligence artificielle basée sur le cloud, dans un contexte de demande croissante de solutions puissantes et rentables.
Les accélérateurs Gaudi 3 sont désormais disponibles dans les régions IBM Cloud de Francfort (UE-DE) et de Washington DC (États-Unis-Est), et leur arrivée à Dallas (États-Unis-Sud) est prévue au deuxième trimestre 2025. Cette extension répond au besoin croissant d'évolutivité des charges de travail de IA générative, offrant une plus grande flexibilité géographique aux organisations mondiales.
Alternative rentable et performance compétitive

L’une des principales attractions de Gaudi 3 sur IBM Cloud est son prix attractif par rapport aux GPU NVIDIA H100 et H200, sans compromettre les performances. Divers tests menés par Signal65 ont montré que le Gaudi 3 surpassait les GPU NVIDIA dans des scénarios spécifiques, en utilisant des modèles de langage tels que Granite (8B) d'IBM et Llama-3.1 de Meta. Bien que les résultats varient selon le type de tâche, les données initiales sont encourageantes.
Intel affirme que le Gaudi 3 offre un 50 % de performances d'inférence en plus et un 40 % d'efficacité énergétique en plus par rapport au H100. De plus, son architecture permet une meilleure mise à l'échelle des tâches d'apprentissage en profondeur grâce à des cœurs de tenseurs programmables, des moteurs de multiplication de matrices spécialisés et une bande passante mémoire.
La puce est fabriquée selon un procédé de 5 nm et intègre 24 ports Ethernet haut débit, ce qui facilite la connectivité rapide entre les nœuds IA. Il est également optimisé pour les environnements utilisant des frameworks comme PyTorch et des modèles intégrés à Hugging Face, renforçant ainsi son compatibilité pour les développeurs et les data scientists.
Diversité des options de déploiement
IBM a conçu plusieurs façons de mettre en œuvre l'accélérateur Gaudi 3 dans son cloud, en s'adaptant à différents besoins commerciaux. Les options disponibles incluent:
- Serveur dédié dans IBM Cloud VPC : Idéal pour ceux qui ont besoin d'un environnement privé et sécurisé avec un contrôle complet sur le logiciel, y compris la prise en charge de Images Red Hat Enterprise Linux axé sur l'IA.
- Nœud de travail dans le conteneur : À partir du deuxième trimestre 2025, IBM proposera des nœuds gérés Gaudi 3 pour les clusters d'IA Red Hat OpenShift, facilitant ainsi leur intégration dans environnements conteneurisés natifs.
- Licence personnalisée avec watsonx : Les clients qui possèdent déjà des licences watsonx.ai pourront les utiliser avec le matériel Gaudi 3, préservant ainsi leur chaîne d'outils et flux de travail personnalisés.
- Architectures déployables (DA) : Modules préconfigurés pour accélérer l'adoption sans intervention manuelle excessive, disponibles au second semestre 2025.
Ces architectures seront disponibles pour les deux Serveurs virtuels depuis l'environnement VPC ainsi que pour les solutions basées sur watsonx et OpenShift sur IBM Cloud.
Support de l'écosystème : Red Hat et Wipro
Red Hat et Wipro ont rejoint cette initiative. Alors que Red Hat met l’accent sur sa engagement envers l'open source et le développement collaboratif, Wipro souligne l'intégration de Gaudi 3 dans son centre d'excellence pour l'IA générative et sa précédente collaboration avec IBM. Bien que les deux partenaires ne fournissent pas de détails techniques approfondis, leurs le soutien donne de la solidité au déploiement conjoint.
Infrastructure sécurisée et axée sur la performance
Dans un domaine où la protection des données sensibles est critique, IBM a intégré Intel TDX (Trust Domain Extensions) dans ses serveurs virtuels VPC. Cette technologie permet de traiter confidentiel avec l'aide du matériel, en assurant isolement et intimité au niveau du serveur virtuel. Cette fonctionnalité devient particulièrement importante dans industries réglementées, comme les soins de santé ou la finance.
L'interopérabilité entre Intel Gaudi 3 et IBM Cloud contribue à réduire les coûts d'exploitation en fournissant un environnement évolutif, polyvalent et sécurisé. Selon les porte-parole des deux entreprises, la collaboration vise à rendre l’intelligence artificielle d’entreprise plus accessible et à accélérer son adoption mondiale.
Approche stratégique à long terme

Cette alliance entre Intel et IBM s’inscrit dans une stratégie multi-fournisseurs visant à diversifier l’offre d’accélérateurs d’IA. Bien que l’intégration initiale puisse être limitée en termes de support généralisé ou d’écosystème de développement par rapport aux leaders du marché, elle représente une option réaliste pour les entreprises qui cherchent à rompre leur dépendance à NVIDIA.
La disponibilité de multiples voies de déploiement, ainsi que les avantages en termes de coût et de consommation d'énergie, renforcent l'attrait du Gaudi 3 comme alternative pour Charges de travail d'IA à la fois en test et en production. Le succès à long terme dépendra en grande partie de l'accueil du marché et le degré d’intégration avec les outils existants.
Le déploiement d’Intel Gaudi 3 sur le Cloud IBM marque une décision stratégique qui pourrait changer la dynamique du marché des accélérateurs d’IA cloud. Grâce à ses multiples modalités de mise en œuvre, ses performances compétitives par rapport aux options plus populaires et ses coûts plus ajustés, il se présente comme une possibilité attractive pour les organisations qui recherchent l'efficacité sans abandonner le contrôle. La participation d’acteurs clés de l’écosystème et l’intégration de technologies de sécurité renforcent sa position d’alternative solide dans les infrastructures d’intelligence artificielle.
Écrivain passionné par le monde des octets et de la technologie en général. J'aime partager mes connaissances à travers l'écriture, et c'est ce que je vais faire dans ce blog, vous montrer toutes les choses les plus intéressantes sur les gadgets, les logiciels, le matériel, les tendances technologiques et plus encore. Mon objectif est de vous aider à naviguer dans le monde numérique de manière simple et divertissante.
