𝗡𝗩𝗜𝗗𝗜𝗔 𝗕𝗟𝗔𝗖𝗞𝗪𝗘𝗟𝗟 𝗡𝗘 𝗠𝗟𝗣𝗘𝗥𝗙 𝗧𝗥𝗔𝗜𝗡𝗜𝗡𝗚 𝟲.𝟬 𝗣𝗔𝗥 𝗚𝗛𝗔𝗟𝗕𝗔 𝗣𝗔 𝗟𝗜𝗔
NVIDIA نے تازہ ترین MLPerf Training 6.0 سوٹ میں تمام سات بینچ مارکس جیت لیے ہیں۔ Blackwell پلیٹ فارم نے ہر زمرے میں سب سے تیز ترین ٹریننگ کے اوقات حاصل کیے ہیں۔
GB300 NVL72 سسٹم نمایاں پیش رفت دکھاتا ہے۔ یہ GB200 NVL72 کے مقابلے میں 1.6x زیادہ تیز ٹریننگ فراہم کرتا ہے۔
کارکردگی کا اہم ڈیٹا:
• GB300 NVL72 نے GB200 NVL72 کے مقابلے میں 1.6x رفتار میں اضافہ حاصل کیا۔ • NVIDIA نے کمپیوٹ ڈینسٹی (compute density) بڑھانے کے لیے NVFP4 پریسیژن کا استعمال کیا۔ • DeepSeek-V3 671B ماڈل کو NVLink کے ذریعے 8,192 GPUs پر ٹرین کیا گیا۔ • نئے Mixture-of-Experts ورک لوڈز میں DeepSeek-V3 671B اور GPT-OSS-20B شامل ہیں۔
بڑے پیمانے پر ٹریننگ کے لیے GPUs کے درمیان وسیع پیمانے پر کمیونیکیشن کی ضرورت ہوتی ہے۔ NVIDIA ایک ریک (rack) میں 72 GPUs کو جوڑنے کے لیے پانچویں نسل کے NVLink Switches کا استعمال کرتا ہے۔ یہ سیٹ اپ انہیں ایک واحد بڑے GPU کے طور پر کام کرنے کی اجازت دیتا ہے۔
کمپنی ان کلسٹرز کے لیے نیٹ ورکنگ کے دو آپشنز فراہم کرتی ہے:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
NVIDIA واحد وینڈر ہے جس نے تمام سات بینچ مارکس کے نتائج جمع کرائے ہیں۔ یہ کارکردگی انہیں Google اور AMD جیسے حریفوں کے مقابلے میں اپنی برتری برقرار رکھنے میں مدد دیتی ہے۔
GB200 سے GB300 تک کی تیز رفتار بہتری ایک تیز انجینئرنگ سائیکل کو ظاہر کرتی ہے۔ یہ رفتار AI ٹریننگ کی صنعت کے لیے ایک اعلیٰ معیار قائم کرتی ہے۔
ذریعہ: blogs.nvidia.com
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi