NVIDIA BlackwellがMLPerf Training 6.0を圧倒
NVIDIAは、最新のMLPerf Training 6.0スイートにおいて、7つのベンチマークすべてで勝利しました。Blackwellプラットフォームは、すべてのカテゴリにおいて最速のトレーニング時間を達成しました。
GB300 NVL72システムは、大幅な進歩を示しています。GB200 NVL72と比較して、1.6倍高速なトレーニングを実現しています。
主要なパフォーマンスデータ:
• GB300 NVL72は、GB200 NVL72に対して1.6倍の高速化を達成しました。 • NVIDIAは、演算密度を高めるためにNVFP4精度を使用しました。 • DeepSeek-V3 671Bモデルは、NVLinkを介して8,192基のGPUでトレーニングされました。 • 新しいMixture-of-Expertsワークロードには、DeepSeek-V3 671BとGPT-OSS-20Bが含まれます。
大規模なトレーニングには、GPU間の膨大な通信が必要です。NVIDIAは、第5世代のNVLink Switchを使用して、1つのラック内の72基のGPUを接続しています。この構成により、それらは単一の巨大なGPUとして動作することが可能になります。
同社は、これらのクラスター向けに2つのネットワーキングオプションを提供しています:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIAは、7つのベンチマークすべてで結果を提出している唯一のベンダーであり続けています。このパフォーマンスにより、GoogleやAMDといった競合他社に対するリードを維持しています。
GB200からGB300への急速な進化は、エンジニアリングサイクルの速さを示しています。このスピードは、AIトレーニング業界に高い基準を打ち立てています。
出典: blogs.nvidia.com
オプションの学習コミュニティ: https://t.me/GyaanSetuAi