NVIDIA BlackwellがMLPerf Training 6.0を圧倒

NVIDIAは、最新のMLPerf Training 6.0スイートにおいて、7つのベンチマークすべてで勝利しました。Blackwellプラットフォームは、すべてのカテゴリにおいて最速のトレーニング時間を達成しました。

GB300 NVL72システムは、大幅な進歩を示しています。GB200 NVL72と比較して、1.6倍高速なトレーニングを実現しています。

主要なパフォーマンスデータ:

• GB300 NVL72は、GB200 NVL72に対して1.6倍の高速化を達成しました。 • NVIDIAは、演算密度を高めるためにNVFP4精度を使用しました。 • DeepSeek-V3 671Bモデルは、NVLinkを介して8,192基のGPUでトレーニングされました。 • 新しいMixture-of-Expertsワークロードには、DeepSeek-V3 671BとGPT-OSS-20Bが含まれます。

大規模なトレーニングには、GPU間の膨大な通信が必要です。NVIDIAは、第5世代のNVLink Switchを使用して、1つのラック内の72基のGPUを接続しています。この構成により、それらは単一の巨大なGPUとして動作することが可能になります。

同社は、これらのクラスター向けに2つのネットワーキングオプションを提供しています:

NVIDIAは、7つのベンチマークすべてで結果を提出している唯一のベンダーであり続けています。このパフォーマンスにより、GoogleやAMDといった競合他社に対するリードを維持しています。

GB200からGB300への急速な進化は、エンジニアリングサイクルの速さを示しています。このスピードは、AIトレーニング業界に高い基準を打ち立てています。

出典: blogs.nvidia.com

オプションの学習コミュニティ: https://t.me/GyaanSetuAi