NVIDIA BLACKWELL DOMINE LE MLPERF TRAINING 6.0

NVIDIA a remporté les sept benchmarks de la dernière suite MLPerf Training 6.0. La plateforme Blackwell a atteint les temps d'entraînement les plus rapides dans toutes les catégories.

Le système GB300 NVL72 affiche des progrès significatifs. Il offre un entraînement 1,6x plus rapide que le GB200 NVL72.

Données de performance clés :

• Le GB300 NVL72 a atteint une accélération de 1,6x par rapport au GB200 NVL72. • NVIDIA a utilisé la précision NVFP4 pour augmenter la densité de calcul. • Le modèle DeepSeek-V3 671B a été entraîné sur 8 192 GPU via NVLink. • Les nouvelles charges de travail Mixture-of-Experts incluent DeepSeek-V3 671B et GPT-OSS-20B.

L'entraînement à grande échelle nécessite une communication massive entre les GPU. NVIDIA utilise des commutateurs NVLink de cinquième génération pour connecter 72 GPU dans une seule baie. Cette configuration leur permet de fonctionner comme un seul et même GPU géant.

L'entreprise propose deux options de mise en réseau pour ces clusters :

NVIDIA reste le seul fournisseur à avoir soumis des résultats pour les sept benchmarks. Cette performance les aide à maintenir leur avance sur des concurrents tels que Google et AMD.

L'amélioration rapide du GB200 au GB300 témoigne d'un cycle d'ingénierie accéléré. Cette rapidité place la barre très haut pour l'industrie de l'entraînement de l'IA.

Source : blogs.nvidia.com

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi