𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗧𝗛Ố𝗡𝗚 𝗧𝗥Ị 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬
NVIDIA đã giành chiến thắng ở cả bảy bài kiểm tra hiệu năng trong bộ MLPerf Training 6.0 mới nhất. Nền tảng Blackwell đã đạt được thời gian huấn luyện nhanh nhất trong mọi hạng mục.
Hệ thống GB300 NVL72 cho thấy sự tiến bộ vượt bậc. Nó mang lại tốc độ huấn luyện nhanh hơn 1,6 lần so với GB200 NVL72.
Dữ liệu hiệu năng chính:
• GB300 NVL72 đạt tốc độ nhanh hơn 1,6 lần so với GB200 NVL72. • NVIDIA đã sử dụng độ chính xác NVFP4 để tăng mật độ tính toán. • Mô hình DeepSeek-V3 671B được huấn luyện trên 8.192 GPU thông qua NVLink. • Các khối lượng công việc Mixture-of-Experts mới bao gồm DeepSeek-V3 671B và GPT-OSS-20B.
Việc huấn luyện quy mô lớn đòi hỏi sự giao tiếp khổng lồ giữa các GPU. NVIDIA sử dụng các bộ chuyển mạch NVLink thế hệ thứ năm để kết nối 72 GPU trong một tủ rack. Thiết lập này cho phép chúng hoạt động như một GPU lớn duy nhất.
Công ty cung cấp hai tùy chọn mạng cho các cụm này:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIA vẫn là nhà cung cấp duy nhất nộp kết quả cho cả bảy bài kiểm tra hiệu năng. Hiệu suất này giúp họ duy trì vị thế dẫn đầu trước các đối thủ cạnh tranh như Google và AMD.
Sự cải tiến nhanh chóng từ GB200 lên GB300 cho thấy một chu kỳ kỹ thuật tốc độ cao. Tốc độ này đặt ra một tiêu chuẩn cao cho ngành công nghiệp huấn luyện AI.
Nguồn: blogs.nvidia.com
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi