𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

📅3 hours ago⏱2 min read

RAM اب نیا GPU ہے

برسوں تک، AI ڈویلپرز کی توجہ صرف ایک چیز پر تھی: کمپیوٹ اسپیڈ (compute speed)۔ آپ CUDA cores اور کلاک اسپیڈز کو دیکھتے تھے۔

وہ دور ختم ہو چکا ہے۔

نیا رکاوٹ (bottleneck) میموری کی گنجائش ہے۔

ایک 70 بلین پیرامیٹر والا ماڈل ٹھیک سے چلانے کے لیے تقریباً 48 سے 50 GB میموری کی ضرورت ہوتی ہے۔ Nvidia RTX 5090 میں صرف 32 GB ہے۔

حساب کتاب سادہ ہے۔ اگر آپ کے ماڈل کے ویٹس (weights) VRAM میں نہیں سما سکتے، تو آپ کو فی سیکنڈ صفر ٹوکنز ملیں گے۔ اگر ماڈل لوڈ ہی نہ ہو سکے تو اسپیڈ کا کوئی فائدہ نہیں۔

ہارڈ ویئر کا موازنہ کریں:

• RTX 5090: 32 GB VRAM، $62.47 فی GB کے حساب سے۔ • Mac Studio M3 Ultra: 512 GB میموری، $18.55 فی GB کے حساب سے۔

Mac Studio 16 گنا زیادہ گنجائش فراہم کرتا ہے اور فی گیگا بائٹ اس کی قیمت 3.4 گنا کم ہے۔

یہ فرق آرکیٹیکچر (architecture) کی وجہ سے ہے۔ Nvidia ڈسکریٹ (discrete) VRAM استعمال کرتا ہے۔ ڈیٹا کو ایک پل (bridge) کے ذریعے CPU اور GPU کے درمیان منتقل ہونا پڑتا ہے۔ جب ماڈلز بڑے ہو جاتے ہیں تو یہ عمل سب کچھ سست کر دیتا ہے۔

Apple یونیفائیڈ میموری (unified memory) استعمال کرتا ہے۔ CPU اور GPU ایک ہی فزیکل اسپیس شیئر کرتے ہیں۔ ڈیٹا کو ادھر ادھر منتقل کرنے کی ضرورت نہیں پڑتی۔ ڈیٹا پہلے سے ہی وہیں موجود ہوتا ہے۔

یہ آپ کے ورک فلو (workflow) کو بدل دیتا ہے:

کوئی ڈیوائس میپنگ نہیں۔
کوئی پیچیدہ ڈسٹری بیوشن فلیگز نہیں۔
ملٹی-GPU کی سردرد نہیں۔

اگر آپ 70B ماڈل چلانا چاہتے ہیں، تو RTX 5090 ناکام ہو جاتا ہے۔ Mac Studio کام کر جاتا ہے۔

اگر آپ DeepSeek V3 چلانا چاہتے ہیں، تو RTX 5090 دم توڑ دیتا ہے۔ Mac Studio اسے اضافی جگہ کے ساتھ لوڈ کر لیتا ہے۔

اب انتخاب واضح ہے:

اگر آپ کا ماڈل 32 GB سے کم ہے: Nvidia استعمال کریں۔ یہ چھوٹے ماڈلز کے لیے تیز ہے۔
اگر آپ کا ماڈل 32 GB سے زیادہ ہے: Mac Studio استعمال کریں۔ Nvidia ان ماڈلز کو بہت زیادہ لاگت یا کوالٹی میں کمی کے بغیر نہیں چلا سکتا۔

بڑے ماڈلز کے لیے ایک ہائی اینڈ Nvidia rig بنانا اکثر ایک مہنگا ویک اینڈ پروجیکٹ بن جاتا ہے۔ آپ صرف کام چلاتے رہنے کے لیے کئی GPUs اور کسٹم کولنگ خریدنے پر مجبور ہو جاتے ہیں۔

ایک Mac Studio آپ کی میز پر رکھا ہوتا ہے۔ یہ کم بجلی استعمال کرتا ہے اور فوری طور پر کام کرتا ہے۔

یہ پوچھنا بند کریں کہ کون سا GPU تیز ترین ہے۔ یہ پوچھنا شروع کریں کہ کون سا پلیٹ فارم اصل میں وہ ماڈلز چلا سکتا ہے جن کی آپ کو ضرورت ہے۔

آپ کا سیٹ اپ کہاں کھڑا ہے؟ کیا آپ Nvidia استعمال کر رہے ہیں یا آپ یونیفائیڈ میموری پر منتقل ہو چکے ہیں؟

Source: https://dev.to/tyson_cung/ram-is-the-new-gpu-why-mac-studio-wins-for-local-llm-inference-3e3b

Optional learning community: https://t.me/GyaanSetuAi

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

Continue reading

𝗡𝗩𝗜𝗗𝗜𝗔 𝗡𝟭𝗫: 𝗧𝗵𝗲 𝗔𝗜 𝗣𝗖 𝗦𝗵𝗶𝗳𝘁

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻 𝗳𝗼𝗿 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗗𝗲𝘃 𝗧𝗼𝗼𝗹

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗡𝘃𝗶𝗱𝗶𝗮 𝗗𝗚𝗫 𝗦𝗽𝗮𝗿𝗸: 𝗔 𝗧𝗼𝗼𝗹 𝗙𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀