CoreWeave 凭借 DeepSeek V3 创下新纪录

Machine-translated. Read the original.

📅3 hours ago⏱1 min read

CoreWeave 使用 DeepSeek-V3 创下新纪录

CoreWeave 在 2 分钟内完成了 DeepSeek-V3 的训练。

这一结果创下了新的 MLPerf v6.0 纪录。它比之前的 AWS 纪录提高了 43%。AWS 完成相同任务耗时 3.5 分钟。

实现方式：

使用了超过 11,000 块 NVIDIA H100 GPU。
将工作负载分布在 4 个数据中心。
使用自定义编排层来管理计算资源。

CoreWeave 还完成了机架级 Nvidia Vera Rubin NVL72 的验证。这使他们成为首个实现此目标的云服务提供商。

为什么这对 AI 至关重要：

在多个站点使用数千块 GPU 可以降低训练成本。
对于 AI 工作负载，专用基础设施优于通用云服务。
DeepSeek-V3 以仅为 GPT-4 一小部分的成本展示了高性能。

CoreWeave 目前正在德克萨斯州建设一个 1.2 GW 的数据中心园区，以扩大这一产能。

关注 AWS 和 Google Cloud 等巨头将如何应对这些速度。

来源：https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

可选学习社区：https://t.me/GyaanSetuAi