𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗗𝗢𝗠𝗜𝗡𝗔𝗧𝗘𝗦 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬

NVIDIA wygrała we wszystkich siedmiu benchmarkach w najnowszym zestawie MLPerf Training 6.0. Platforma Blackwell osiągnęła najkrótsze czasy trenowania we wszystkich kategoriach.

System GB300 NVL72 wykazuje znaczący postęp. Zapewnia on 1,6-krotnie szybsze trenowanie niż GB200 NVL72.

Kluczowe dane wydajnościowe:

• GB300 NVL72 osiągnął 1,6-krotne przyspieszenie względem GB200 NVL72. • NVIDIA wykorzystała precyzję NVFP4, aby zwiększyć gęstość obliczeniową. • Model DeepSeek-V3 671B był trenowany na 8 192 procesorach GPU za pomocą NVLink. • Nowe obciążenia typu Mixture-of-Experts obejmują modele DeepSeek-V3 671B oraz GPT-OSS-20B.

Trenowanie na dużą skalę wymaga masowej komunikacji między procesorami GPU. NVIDIA wykorzystuje przełączniki NVLink piątej generacji, aby połączyć 72 procesory GPU w jednej szafie rackowej. Taka konfiguracja pozwala im pracować jako jeden duży procesor GPU.

Firma oferuje dwie opcje sieciowe dla tych klastrów:

NVIDIA pozostaje jedynym dostawcą, który przesłał wyniki dla wszystkich siedmiu benchmarków. Ta wydajność pomaga im utrzymać przewagę nad konkurentami, takimi jak Google i AMD.

Szybka poprawa wydajności od GB200 do GB300 świadczy o błyskawicznym cyklu inżynieryjnym. Ta prędkość stawia poprzeczkę bardzo wysoko dla całej branży trenowania modeli AI.

Źródło: blogs.nvidia.com

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi