CoreWeave thiết lập kỷ lục mới với DeepSeek V3

📅3 hours ago⏱1 min read

CoreWeave Thiết Lập Kỷ Lục Mới Với DeepSeek-V3

CoreWeave đã huấn luyện DeepSeek-V3 trong 2 phút.

Kết quả này thiết lập một kỷ lục MLPerf v6.0 mới. Nó vượt qua kỷ lục trước đó của AWS tới 43%. AWS đã mất 3,5 phút để hoàn thành cùng một tác vụ.

Cách họ đã thực hiện:

Sử dụng hơn 11.000 GPU NVIDIA H100.
Phân bổ khối lượng công việc trên 4 trung tâm dữ liệu.
Sử dụng một lớp điều phối (orchestration layer) tùy chỉnh để quản lý tính toán.

CoreWeave cũng đã xác thực Nvidia Vera Rubin NVL72 ở quy mô tủ rack. Điều này giúp họ trở thành nhà cung cấp đám mây đầu tiên thực hiện được điều này.

Tại sao điều này lại quan trọng đối với AI:

Chi phí huấn luyện giảm xuống khi bạn sử dụng hàng nghìn GPU tại nhiều địa điểm khác nhau.
Cơ sở hạ tầng chuyên dụng vượt trội hơn các dịch vụ đám mây thông thường đối với các khối lượng công việc AI.
DeepSeek-V3 cho thấy hiệu suất cao với chi phí chỉ bằng một phần nhỏ so với GPT-4.

CoreWeave hiện đang xây dựng một tổ hợp trung tâm dữ liệu 1,2 GW tại Texas để mở rộng công suất này.

Hãy xem các ông lớn như AWS và Google Cloud phản ứng thế nào với tốc độ này.

Nguồn: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi

CoreWeave thiết lập kỷ lục mới với DeepSeek V3

Continue reading

𝗪𝗲𝗲𝗸𝗹𝘆 𝗔𝗜 𝗥𝗼𝘂𝗻𝗱𝘂𝗽: 𝗝𝘂𝗻𝗲 𝟬𝟰, 𝟮𝟬𝟮𝟲

DeepSeek huy động vốn khổng lồ với mức định giá gây kinh ngạc 50 tỷ USD

RAM là GPU mới

𝗔𝗜 𝗕𝘂𝗶𝗹𝘁 𝗠𝘆 𝗨𝗜 𝗶𝗻 𝟮 𝗛𝗼𝘂𝗿𝘀. 𝗧𝗵𝗲𝗻 𝗜 𝗦𝗽𝗲𝗻𝘁 𝟯 𝗪𝗲𝗲𝗸𝘀 𝗙𝗶𝘅𝗶𝗻𝗴 𝗜𝘁.

AI Gateway: Hệ thống thần kinh trung tâm cho các LLM doanh nghiệp