NVIDIA Blackwell 统治 MLPerf Training 6.0

NVIDIA 在最新的 MLPerf Training 6.0 测试套件中赢得了全部七项基准测试。Blackwell 平台在所有类别中均实现了最快的训练时间。

GB300 NVL72 系统展现出显著的进步。其训练速度比 GB200 NVL72 快 1.6 倍。

关键性能数据:

• GB300 NVL72 相比 GB200 NVL72 实现了 1.6 倍的加速。 • NVIDIA 使用 NVFP4 精度来提高计算密度。 • DeepSeek-V3 671B 模型通过 NVLink 在 8,192 个 GPU 上进行了训练。 • 新的混合专家 (Mixture-of-Experts) 工作负载包括 DeepSeek-V3 671B 和 GPT-OSS-20B。

大规模训练需要 GPU 之间进行海量通信。NVIDIA 使用第五代 NVLink Switches 将单个机架中的 72 个 GPU 连接起来。这种配置使它们能够作为一个单一的大型 GPU 来协同工作。

公司为这些集群提供了两种网络选项:

NVIDIA 仍然是唯一一家提交了全部七项基准测试结果的厂商。这一性能表现有助于他们在面对 Google 和 AMD 等竞争对手时保持领先地位。

从 GB200 到 GB300 的快速提升展示了极快的工程迭代周期。这种速度为 AI 训练行业树立了极高的标杆。

来源:blogs.nvidia.com

可选学习社区:https://t.me/GyaanSetuAi