NVIDIA BLACKWELL, MLPERF TRAINING 6.0을 압도하다
NVIDIA는 최신 MLPerf Training 6.0 제품군에서 7개 벤치마크 모두에서 우승했습니다. Blackwell 플랫폼은 모든 카테고리에서 가장 빠른 학습 시간을 달성했습니다.
GB300 NVL72 시스템은 상당한 진전을 보여줍니다. GB200 NVL72보다 1.6배 빠른 학습 성능을 제공합니다.
주요 성능 데이터:
• GB300 NVL72는 GB200 NVL72 대비 1.6배의 속도 향상을 달성했습니다. • NVIDIA는 연산 밀도를 높이기 위해 NVFP4 정밀도를 사용했습니다. • DeepSeek-V3 671B 모델은 NVLink를 통해 8,192개의 GPU에서 학습되었습니다. • 새로운 Mixture-of-Experts 워크로드에는 DeepSeek-V3 671B 및 GPT-OSS-20B가 포함됩니다.
대규모 학습에는 GPU 간의 방대한 통신이 필요합니다. NVIDIA는 5세대 NVLink Switch를 사용하여 하나의 랙에 72개의 GPU를 연결합니다. 이 설정을 통해 GPU들은 하나의 거대한 GPU처럼 작동할 수 있습니다.
이 클러스터를 위해 회사는 두 가지 네트워킹 옵션을 제공합니다:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIA는 7개 벤치마크 모두에 대한 결과를 제출한 유일한 벤더로 남아 있습니다. 이러한 성능은 Google 및 AMD와 같은 경쟁사들에 맞서 선두를 유지하는 데 도움이 됩니다.
GB200에서 GB300으로의 급격한 개선은 빠른 엔지니어링 사이클을 보여줍니다. 이러한 속도는 AI 학습 산업의 기준을 높이고 있습니다.
출처: blogs.nvidia.com
선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi