NVIDIA Blackwell 统治 MLPerf Training 6.0
NVIDIA 在最新的 MLPerf Training 6.0 测试套件中赢得了全部七项基准测试。Blackwell 平台在所有类别中均实现了最快的训练时间。
GB300 NVL72 系统展现出显著的进步。其训练速度比 GB200 NVL72 快 1.6 倍。
关键性能数据:
• GB300 NVL72 相比 GB200 NVL72 实现了 1.6 倍的加速。 • NVIDIA 使用 NVFP4 精度来提高计算密度。 • DeepSeek-V3 671B 模型通过 NVLink 在 8,192 个 GPU 上进行了训练。 • 新的混合专家 (Mixture-of-Experts) 工作负载包括 DeepSeek-V3 671B 和 GPT-OSS-20B。
大规模训练需要 GPU 之间进行海量通信。NVIDIA 使用第五代 NVLink Switches 将单个机架中的 72 个 GPU 连接起来。这种配置使它们能够作为一个单一的大型 GPU 来协同工作。
公司为这些集群提供了两种网络选项:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIA 仍然是唯一一家提交了全部七项基准测试结果的厂商。这一性能表现有助于他们在面对 Google 和 AMD 等竞争对手时保持领先地位。
从 GB200 到 GB300 的快速提升展示了极快的工程迭代周期。这种速度为 AI 训练行业树立了极高的标杆。
来源:blogs.nvidia.com
可选学习社区:https://t.me/GyaanSetuAi