𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

📅3 hours ago⏱2 min read

RAM ही नया GPU है

सालों से, AI डेवलपर्स केवल एक ही चीज़ पर ध्यान केंद्रित कर रहे थे: कंप्यूट स्पीड। आप CUDA cores और क्लॉक स्पीड देखते थे।

वह युग अब समाप्त हो चुका है।

नया बॉटलनेक मेमोरी कैपेसिटी है।

एक 70-बिलियन-पैरामीटर मॉडल को ठीक से चलाने के लिए लगभग 48 से 50 GB मेमोरी की आवश्यकता होती है। Nvidia RTX 5090 में केवल 32 GB है।

गणित सरल है। यदि आपके मॉडल वेट्स (model weights) VRAM में फिट नहीं होते हैं, तो आपको प्रति सेकंड शून्य टोकन मिलेंगे। यदि मॉडल लोड ही नहीं हो सकता, तो स्पीड का कोई महत्व नहीं रह जाता।

हार्डवेयर की तुलना करें:

• RTX 5090: 32 GB VRAM, $62.47 प्रति GB पर। • Mac Studio M3 Ultra: 512 GB मेमोरी, $18.55 प्रति GB पर।

Mac Studio 16 गुना अधिक क्षमता प्रदान करता है और प्रति गीगाबाइट इसकी लागत 3.4 गुना कम है।

यह अंतर आर्किटेक्चर (architecture) के कारण है। Nvidia discrete VRAM का उपयोग करता है। डेटा को एक ब्रिज के माध्यम से CPU और GPU के बीच स्थानांतरित होना पड़ता है। जब मॉडल बड़े हो जाते हैं, तो यह सब कुछ धीमा कर देता है।

Apple unified memory का उपयोग करता है। CPU और GPU एक ही फिजिकल स्पेस साझा करते हैं। डेटा को इधर-उधर भेजने की आवश्यकता नहीं होती। डेटा पहले से ही वहीं मौजूद होता है।

यह आपके वर्कफ़्लो (workflow) को बदल देता है:

कोई डिवाइस मैपिंग नहीं।
कोई जटिल डिस्ट्रीब्यूशन फ्लैग्स नहीं।
कोई मल्टी-GPU सिरदर्द नहीं।

यदि आप 70B मॉडल चलाना चाहते हैं, तो RTX 5090 विफल हो जाता है। Mac Studio काम करता है।

यदि आप DeepSeek V3 चलाना चाहते हैं, तो RTX 5090 दम तोड़ देता है। Mac Studio इसे पर्याप्त जगह के साथ लोड कर देता है।

विकल्प अब स्पष्ट है:

यदि आपका मॉडल 32 GB से कम है: Nvidia का उपयोग करें। छोटे मॉडल्स के लिए यह तेज़ है।
यदि आपका मॉडल 32 GB से अधिक है: Mac Studio का उपयोग करें। Nvidia भारी लागत या गुणवत्ता में कमी के बिना इन मॉडल्स को नहीं चला सकता।

बड़े मॉडल्स के लिए एक हाई-एंड Nvidia रिग (rig) बनाना अक्सर एक महंगा वीकेंड प्रोजेक्ट बन जाता है। आप केवल काम चलाने के लिए कई GPUs और कस्टम कूलिंग खरीदने के लिए मजबूर हो जाते हैं।

एक Mac Studio आपकी डेस्क पर रखा होता है। यह कम बिजली लेता है और तुरंत काम करता है।

यह पूछना बंद करें कि कौन सा GPU सबसे तेज़ है। यह पूछना शुरू करें कि कौन सा प्लेटफॉर्म वास्तव में उन मॉडल्स को चलाता है जिनकी आपको आवश्यकता है।

आपका सेटअप किस स्थिति में है? क्या आप Nvidia का उपयोग कर रहे हैं या आप unified memory पर चले गए हैं?

स्रोत: https://dev.to/tyson_cung/ram-is-the-new-gpu-why-mac-studio-wins-for-local-llm-inference-3e3b

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

Continue reading

NVIDIA N1X: AI PC का बदलाव

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻 𝗳𝗼𝗿 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗗𝗲𝘃 𝗧𝗼𝗼𝗹

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗡𝘃𝗶𝗱𝗶𝗮 𝗗𝗚𝗫 𝗦𝗽𝗮𝗿𝗸: 𝗔 𝗧𝗼𝗼𝗹 𝗙𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀