NVIDIA BlackwellがMLPerf Training 6.0を席巻

📅4 hours ago⏱1 min read

NVIDIA BlackwellがMLPerf Training 6.0を圧倒

NVIDIAは、最新のMLPerf Training 6.0スイートにおいて、7つのベンチマークすべてで勝利しました。Blackwellプラットフォームは、すべてのカテゴリにおいて最速のトレーニング時間を達成しました。

GB300 NVL72システムは、大幅な進歩を示しています。GB200 NVL72と比較して、1.6倍高速なトレーニングを実現しています。

主要なパフォーマンスデータ：

• GB300 NVL72は、GB200 NVL72に対して1.6倍の高速化を達成しました。 • NVIDIAは、演算密度を高めるためにNVFP4精度を使用しました。 • DeepSeek-V3 671Bモデルは、NVLinkを介して8,192基のGPUでトレーニングされました。 • 新しいMixture-of-Expertsワークロードには、DeepSeek-V3 671BとGPT-OSS-20Bが含まれます。

大規模なトレーニングには、GPU間の膨大な通信が必要です。NVIDIAは、第5世代のNVLink Switchを使用して、1つのラック内の72基のGPUを接続しています。この構成により、それらは単一の巨大なGPUとして動作することが可能になります。

同社は、これらのクラスター向けに2つのネットワーキングオプションを提供しています：

NVIDIA Quantum InfiniBand
NVIDIA Spectrum-X Ethernet

NVIDIAは、7つのベンチマークすべてで結果を提出している唯一のベンダーであり続けています。このパフォーマンスにより、GoogleやAMDといった競合他社に対するリードを維持しています。

GB200からGB300への急速な進化は、エンジニアリングサイクルの速さを示しています。このスピードは、AIトレーニング業界に高い基準を打ち立てています。

出典: blogs.nvidia.com

オプションの学習コミュニティ: https://t.me/GyaanSetuAi

NVIDIA BlackwellがMLPerf Training 6.0を席巻

Continue reading

𝗡𝗩𝗜𝗗𝗜𝗔 𝗡𝟭𝗫: 𝗧𝗵𝗲 𝗔𝗜 𝗣𝗖 𝗦𝗵𝗶𝗳𝘁

Nvidia DGX Spark: 開発者向けツール

CoreWeaveがDeepSeek V3で新記録を樹立

𝗚𝗟𝗠 𝟱.𝟮 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗟𝗲𝗮𝗱𝗲𝗿 𝗜𝗻 𝗢𝗽𝗲𝗻 𝗦𝗼𝘂𝗿𝗰𝗲 𝗔𝗜

Nvidiaの研究者、AIコーディングエージェントを用いてロボットの自己学習を可能に