अब किसी को आपके 70B पैरामीटर मॉडल की ज़रूरत नहीं है

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

20 घंटे पहले2मिनट पढ़ें

अब किसी को आपके 70B पैरामीटर मॉडल की ज़रूरत नहीं है

AI की दुनिया पहले केवल स्केल (scale) पर ध्यान केंद्रित करती थी।

लोग बड़े मॉडल्स, बड़े कॉन्टेक्स्ट विंडोज़ (context windows) और बड़े बेंचमार्क के पीछे भागते थे। यदि आपका मॉडल विशाल नहीं था, तो आप इस खेल में शामिल ही नहीं थे।

वह युग समाप्त हो रहा है।

विशाल मॉडल्स प्रभावशाली होते हैं। लेकिन अधिकांश लोगों को इतनी अधिक शक्ति की आवश्यकता नहीं होती है। कार डैशबोर्ड असिस्टेंट को कविताएँ लिखने की आवश्यकता नहीं है। उसे बस "AC कम कर दो" को समझना है और बिना बैटरी खत्म किए काम करना है।

पाँच मुख्य कारणों से छोटे, विशिष्ट (specialized) मॉडल्स अब हावी हो रहे हैं:

ऑन-डिवाइस उपयोग: अब फोन में छोटे मॉडल्स को स्थानीय रूप से (locally) चलाने के लिए हार्डवेयर उपलब्ध है। आपका असिस्टेंट बिना इंटरनेट के किसी टनल या उड़ान के दौरान भी काम कर सकता है।
गोपनीयता और नियमन: अस्पताल और लॉ फर्म संवेदनशील डेटा किसी थर्ड-पार्टी API को नहीं भेज सकते। लोकल हार्डवेयर पर छोटा मॉडल चलाने से डेटा संस्थान के भीतर ही सुरक्षित रहता है।
कम लेटेंसी (Low latency): एक सेल्फ-ड्राइविंग कार यह तय करने के लिए क्लाउड सर्वर का इंतज़ार नहीं कर सकती कि कोई आकृति पैदल यात्री है या नहीं। मॉडल वहीं होना चाहिए जहाँ निर्णय लिया जाना है।
कम लागत: एक विशाल मॉडल पर लाखों रिक्वेस्ट चलाना आपके प्रॉफिट मार्जिन को खत्म कर देता है। एक ट्यून्ड (tuned) छोटा मॉडल अक्सर सस्ता और अधिक टिकाऊ होता है।
खराब कनेक्टिविटी: दुनिया के कई हिस्सों में इंटरनेट निरंतर उपलब्ध नहीं है। छोटे मॉडल्स उत्पादों को ऑफलाइन काम करने की अनुमति देते हैं।

आप तीन मुख्य तरीकों का उपयोग करके मॉडल्स को छोटा बना सकते हैं:

क्वांटाइजेशन (Quantization): जगह बचाने के लिए मॉडल वेट्स (weights) की सटीकता (precision) को कम करना।
प्रूनिंग (Pruning): उन अनावश्यक कनेक्शनों को हटाना जो कोई मूल्य नहीं जोड़ते।
नॉलेज डिस्टिलेशन (Knowledge distillation): एक बड़े मॉडल का उपयोग करके एक छोटे मॉडल को यह सिखाना कि उसके तर्क (reasoning) की नकल कैसे की जाए।

यह बदलाव आवश्यक कौशल (skill set) को बदल देता है।

एक विशाल मॉडल को प्रॉम्प्ट (prompting) करना एक कौशल है। एक विशिष्ट मॉडल को चुनना, फाइन-ट्यून करना और तैनात (deploy) करना एक अलग इंजीनियरिंग चुनौती है। यह गति, लागत और सटीकता के बीच संतुलन (tradeoffs) बनाने के बारे में है।

एक ऐसा विशाल टूल बनाने की कोशिश करना बंद करें जो सब कुछ खराब तरीके से करता हो। इसके बजाय कई छोटे टूल बनाएं जो एक काम को अच्छी तरह से करते हों।

छोटा मॉडल कोई डाउनग्रेड नहीं है। यह काम के लिए एक बेहतर टूल है।

स्रोत: https://dev.to/blakcodes/nobody-wants-your-70b-parameter-model-anymore-56jo

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

अब किसी को आपके 70B पैरामीटर मॉडल की ज़रूरत नहीं है

पढ़ना जारी रखें

AI प्रॉम्प्ट्स से कहीं बढ़कर है

AI प्रॉम्प्ट्स से कहीं बढ़कर है

जब कॉन्टेक्स्ट विंडोज मायने रखना बंद कर दें

AI को बड़े कॉन्टेक्स्ट विंडोज़ की तुलना में स्टेट मैनेजमेंट की अधिक आवश्यकता क्यों है?

𝗧𝗵𝗲 𝗙𝘂𝘁𝘂𝗿𝗲 𝗼𝗳 𝗔𝗜 𝗜𝘀 𝗡𝗼𝘁 𝗔𝗯𝗼𝘂𝘁 𝗠𝗼𝗱𝗲𝗹𝘀. 𝗜𝘁'𝘀 𝗔𝗯𝗼𝘂𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴.