CoreWeave 使用 DeepSeek-V3 创下新纪录
CoreWeave 在 2 分钟内完成了 DeepSeek-V3 的训练。
这一结果创下了新的 MLPerf v6.0 纪录。它比之前的 AWS 纪录提高了 43%。AWS 完成相同任务耗时 3.5 分钟。
实现方式:
- 使用了超过 11,000 块 NVIDIA H100 GPU。
- 将工作负载分布在 4 个数据中心。
- 使用自定义编排层来管理计算资源。
CoreWeave 还完成了机架级 Nvidia Vera Rubin NVL72 的验证。这使他们成为首个实现此目标的云服务提供商。
为什么这对 AI 至关重要:
- 在多个站点使用数千块 GPU 可以降低训练成本。
- 对于 AI 工作负载,专用基础设施优于通用云服务。
- DeepSeek-V3 以仅为 GPT-4 一小部分的成本展示了高性能。
CoreWeave 目前正在德克萨斯州建设一个 1.2 GW 的数据中心园区,以扩大这一产能。
关注 AWS 和 Google Cloud 等巨头将如何应对这些速度。
来源:https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4
可选学习社区:https://t.me/GyaanSetuAi