Intel Omni-Path trở lại để thách thức Nvidia
Cornelis Networks đang hồi sinh Intel Omni-Path. Công nghệ này giờ đây sẽ kết nối các siêu máy tính của Bộ Năng lượng Hoa Kỳ. Nó đóng vai trò là một giải pháp thay thế trực tiếp cho Nvidia InfiniBand.
Intel đã ngừng sản xuất Omni-Path vào năm 2019. Hiện tại, Cornelis Networks đang sử dụng nó để cung cấp tốc độ 400Gbps. Bước đi này giúp Bộ Năng lượng tránh việc chỉ phụ thuộc vào phần cứng của Nvidia.
Các chi tiết chính của phần cứng mới:
• Bộ chuyển mạch Cornelis CN5000 hỗ trợ 200 cổng. • Mỗi cổng chạy ở tốc độ 400Gbps. • Độ trễ duy trì dưới 100 nan giây mỗi bước nhảy (hop). • Công nghệ này sử dụng mô hình truy cập bộ nhớ trực tiếp (direct memory access). • Mô hình này giúp tránh chi phí xử lý (overhead) của TCP/IP để duy trì tốc độ cao.
Tại sao điều này lại quan trọng đối với AI và Siêu máy tính:
Việc huấn luyện AI quy mô lớn đòi hỏi các kết nối nhanh giữa các chip. InfiniBand hiện là công nghệ dẫn đầu. Tuy nhiên, Omni-Path tuyên bố có độ trễ đuôi (tail latency) thấp hơn. Độ trễ thấp là yếu tố sống còn đối với các tác vụ huấn luyện mô hình.
Bộ Năng lượng có kế hoạch sử dụng công nghệ này cho các hệ thống exascale trong khoảng thời gian từ năm 2027 đến 2028.
Những thách thức phía trước:
Nvidia có lợi thế khổng lồ với hệ sinh thái phần mềm của mình. Omni-Path yêu cầu các trình điều khiển (drivers) và thư viện (libraries) cụ thể. Thành công phụ thuộc vào việc phần mềm hoạt động tốt như thế nào với các công cụ AI hiện có.
Cornelis Networks cũng phải đối mặt với sự cạnh tranh từ Ultra Ethernet Consortium. Nhóm này bao gồm cả AMD và Intel. Cuộc đua thống trị mạng lưới siêu máy tính đang trở nên gay gắt hơn.
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi