Intel Omni-Path 回归,挑战 Nvidia

Cornelis Networks 正在让 Intel Omni-Path 重获新生。这项技术现在将用于连接美国能源部的超级计算机。它将作为 Nvidia InfiniBand 的直接替代方案。

Intel 已于 2019 年停止生产 Omni-Path。现在,Cornelis Networks 利用它提供 400Gbps 的速率。此举有助于能源部避免仅依赖 Nvidia 硬件。

新硬件的关键细节:

• Cornelis CN5000 交换机支持 200 个端口。 • 每个端口的速率为 400Gbps。 • 每跳延迟保持在 100 纳秒以下。 • 该技术采用直接内存访问模型。 • 该模型避免了 TCP/IP 开销,以保持高速运行。

为什么这对 AI 和超级计算至关重要:

大规模 AI 训练需要芯片之间的高速连接。InfiniBand 是目前的领导者。然而,Omni-Path 声称具有更低的尾部延迟。低延迟对于模型训练任务至关重要。

美国能源部计划在 2027 年至 2028 年间将其用于百亿亿级 (exascale) 系统。

面临的挑战:

Nvidia 凭借其软件生态系统拥有巨大的优势。Omni-Path 需要特定的驱动程序和库。其成功取决于软件与现有 AI 工具的兼容程度。

Cornelis Networks 还面临来自 Ultra Ethernet Consortium 的竞争。该联盟包括 AMD 和 Intel。争夺超级计算机网络主导地位的竞赛正在升温。

Source: https://dev.to/gentic_news/intel-omni-path-resurfaces-as-infiniband-rival-for-doe-supercomputers-3j14

Optional learning community: https://t.me/GyaanSetuAi