𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗗𝗢𝗠𝗜𝗡𝗔𝗧𝗘𝗦 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬
NVIDIA wygrała we wszystkich siedmiu benchmarkach w najnowszym zestawie MLPerf Training 6.0. Platforma Blackwell osiągnęła najkrótsze czasy trenowania we wszystkich kategoriach.
System GB300 NVL72 wykazuje znaczący postęp. Zapewnia on 1,6-krotnie szybsze trenowanie niż GB200 NVL72.
Kluczowe dane wydajnościowe:
• GB300 NVL72 osiągnął 1,6-krotne przyspieszenie względem GB200 NVL72. • NVIDIA wykorzystała precyzję NVFP4, aby zwiększyć gęstość obliczeniową. • Model DeepSeek-V3 671B był trenowany na 8 192 procesorach GPU za pomocą NVLink. • Nowe obciążenia typu Mixture-of-Experts obejmują modele DeepSeek-V3 671B oraz GPT-OSS-20B.
Trenowanie na dużą skalę wymaga masowej komunikacji między procesorami GPU. NVIDIA wykorzystuje przełączniki NVLink piątej generacji, aby połączyć 72 procesory GPU w jednej szafie rackowej. Taka konfiguracja pozwala im pracować jako jeden duży procesor GPU.
Firma oferuje dwie opcje sieciowe dla tych klastrów:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIA pozostaje jedynym dostawcą, który przesłał wyniki dla wszystkich siedmiu benchmarków. Ta wydajność pomaga im utrzymać przewagę nad konkurentami, takimi jak Google i AMD.
Szybka poprawa wydajności od GB200 do GB300 świadczy o błyskawicznym cyklu inżynieryjnym. Ta prędkość stawia poprzeczkę bardzo wysoko dla całej branży trenowania modeli AI.
Źródło: blogs.nvidia.com
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi