NVIDIA Blackwell MLPerf Training 6.0-এ আধিপত্য বিস্তার করেছে
NVIDIA সর্বশেষ MLPerf Training 6.0 স্যুটে সাতটি বেঞ্চমার্কের সবকটিতেই জয়ী হয়েছে। Blackwell প্ল্যাটফর্ম প্রতিটি ক্যাটাগরিতে দ্রুততম ট্রেনিং সময় অর্জন করেছে।
GB300 NVL72 সিস্টেম উল্লেখযোগ্য অগ্রগতি প্রদর্শন করেছে। এটি GB200 NVL72-এর তুলনায় ১.৬ গুণ দ্রুত ট্রেনিং প্রদান করে।
মূল পারফরম্যান্স ডেটা:
• GB300 NVL72, GB200 NVL72-এর তুলনায় ১.৬ গুণ গতি বৃদ্ধি করেছে। • কম্পিউট ডেনসিটি (compute density) বৃদ্ধির জন্য NVIDIA NVFP4 precision ব্যবহার করেছে। • DeepSeek-V3 671B মডেলটি NVLink-এর মাধ্যমে ৮,১৯২টি GPU-তে ট্রেনিং করা হয়েছে। • নতুন Mixture-of-Experts ওয়ার্কলোডগুলোর মধ্যে রয়েছে DeepSeek-V3 671B এবং GPT-OSS-20B।
বড় স্কেলের ট্রেনিংয়ের জন্য GPU-গুলোর মধ্যে ব্যাপক যোগাযোগের প্রয়োজন হয়। NVIDIA একটি র্যাকে ৭২টি GPU সংযুক্ত করতে পঞ্চম প্রজন্মের NVLink Switches ব্যবহার করে। এই সেটআপটি তাদের একটি একক বড় GPU হিসেবে কাজ করতে সাহায্য করে।
কোম্পানিটি এই ক্লাস্টারগুলোর জন্য দুটি নেটওয়ার্কিং অপশন প্রদান করে:
- NVIDIA Quantum InfiniBand
- NVIDIA Spectrum-X Ethernet
সাতটি বেঞ্চমার্কের সবকটির ফলাফল জমা দেওয়া একমাত্র ভেন্ডর হিসেবে NVIDIA এখনও অপ্রতিদ্বন্দ্বী। এই পারফরম্যান্স তাদের Google এবং AMD-এর মতো প্রতিযোগীদের বিরুদ্ধে তাদের নেতৃত্ব বজায় রাখতে সাহায্য করে।
GB200 থেকে GB300-এ দ্রুত উন্নতি একটি দ্রুত ইঞ্জিনিয়ারিং সাইকেল প্রদর্শন করে। এই গতি AI ট্রেনিং শিল্পের জন্য একটি উচ্চ মানদণ্ড স্থাপন করেছে।
উৎস: blogs.nvidia.com
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi