𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗗𝗢𝗠𝗜𝗡𝗔 𝗢 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬
A NVIDIA venceu todos os sete benchmarks na mais recente suíte MLPerf Training 6.0. A plataforma Blackwell alcançou os tempos de treinamento mais rápidos em todas as categorias.
O sistema GB300 NVL72 mostra um progresso significativo. Ele entrega um treinamento 1,6x mais rápido que o GB200 NVL72.
Dados de desempenho principais:
• O GB300 NVL72 alcançou um aumento de velocidade de 1,6x em relação ao GB200 NVL72. • A NVIDIA utilizou a precisão NVFP4 para aumentar a densidade de computação. • O modelo DeepSeek-V3 671B foi treinado em 8.192 GPUs via NVLink. • As novas cargas de trabalho de Mixture-of-Experts incluem o DeepSeek-V3 671B e o GPT-OSS-20B.
O treinamento em larga escala exige uma comunicação massiva entre as GPUs. A NVIDIA utiliza switches NVLink de quinta geração para conectar 72 GPUs em um único rack. Essa configuração permite que elas funcionem como uma única GPU de grande porte.
A empresa oferece duas opções de rede para esses clusters:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
A NVIDIA continua sendo o único fornecedor a enviar resultados para todos os sete benchmarks. Esse desempenho ajuda a manter sua liderança contra concorrentes como Google e AMD.
A rápida evolução do GB200 para o GB300 demonstra um ciclo de engenharia acelerado. Essa velocidade estabelece um patamar elevado para a indústria de treinamento de IA.
Fonte: blogs.nvidia.com
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi