𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗗𝗢𝗠𝗜𝗡𝗔 𝗢 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬

A NVIDIA venceu todos os sete benchmarks na mais recente suíte MLPerf Training 6.0. A plataforma Blackwell alcançou os tempos de treinamento mais rápidos em todas as categorias.

O sistema GB300 NVL72 mostra um progresso significativo. Ele entrega um treinamento 1,6x mais rápido que o GB200 NVL72.

Dados de desempenho principais:

• O GB300 NVL72 alcançou um aumento de velocidade de 1,6x em relação ao GB200 NVL72. • A NVIDIA utilizou a precisão NVFP4 para aumentar a densidade de computação. • O modelo DeepSeek-V3 671B foi treinado em 8.192 GPUs via NVLink. • As novas cargas de trabalho de Mixture-of-Experts incluem o DeepSeek-V3 671B e o GPT-OSS-20B.

O treinamento em larga escala exige uma comunicação massiva entre as GPUs. A NVIDIA utiliza switches NVLink de quinta geração para conectar 72 GPUs em um único rack. Essa configuração permite que elas funcionem como uma única GPU de grande porte.

A empresa oferece duas opções de rede para esses clusters:

A NVIDIA continua sendo o único fornecedor a enviar resultados para todos os sete benchmarks. Esse desempenho ajuda a manter sua liderança contra concorrentes como Google e AMD.

A rápida evolução do GB200 para o GB300 demonstra um ciclo de engenharia acelerado. Essa velocidade estabelece um patamar elevado para a indústria de treinamento de IA.

Fonte: blogs.nvidia.com

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi