𝗜𝗻𝘁𝗿𝗼 𝘁𝗼 𝗚𝗲𝗻 𝗔𝗜 𝗳𝗼𝗿 𝗣𝘆𝘁𝗵𝗼𝗻 𝗕𝗲𝗴𝗶𝗻𝗻𝗲𝗿𝘀
अधिकांश डेवलपर्स निश्चित नियमों (fixed rules) का उपयोग करके कोड लिखते हैं। आप इनपुट लेते हैं, if/else स्टेटमेंट्स या लूप्स लागू करते हैं, और एक अनुमानित परिणाम (predictable result) प्राप्त करते हैं। यह JSON या CSV जैसे स्ट्रक्चर्ड डेटा के लिए काम करता है।
लेकिन अव्यवस्थित (messy) कार्यों का क्या?
- 100 सपोर्ट टिकटों का सारांश बनाना।
- फीचर लिस्ट को ईमेल में बदलना।
- ब्लॉग पोस्ट से फायदे और नुकसान की तुलना करना।
आप regex या जटिल टेम्पलेट्स का उपयोग कर सकते हैं, लेकिन वे नाजुक (fragile) होते हैं। Generative AI इस तरह के अस्पष्ट (fuzzy) कार्यों को आसानी से संभाल लेता है।
यह कैसे काम करता है
एक जनरेटिव मॉडल एक सरल लूप का पालन करता है:
- यह आपके प्रॉम्प्ट और पिछले टेक्स्ट को देखता है।
- यह टेक्स्ट के अगले छोटे हिस्से का अनुमान लगाता है।
- यह उस हिस्से को टेक्स्ट में जोड़ देता है।
- यह तब तक इसे दोहराता रहता है जब तक कार्य पूरा न हो जाए।
Large Language Models (LLMs) एक आर्किटेक्चर का उपयोग करते हैं जिसे transformer कहा जाता है। बाएं से दाएं पढ़ने के बजाय, मॉडल आपके इनपुट के सभी हिस्सों को एक साथ देखता है। यह तय करता है कि अगले अनुमान के लिए कौन से शब्द सबसे महत्वपूर्ण हैं।
Python डेवलपर्स के लिए दो चीजें महत्वपूर्ण हैं: tokens और context windows।
Tokens मॉडल्स रॉ स्ट्रिंग्स (raw strings) नहीं पढ़ते हैं। वे टेक्स्ट को tokens में तोड़ देते हैं। एक token शब्द का एक छोटा हिस्सा होता है। API की कीमत और सीमाएं characters के बजाय tokens का उपयोग करती हैं।
Context Window यह उस टेक्स्ट की मात्रा है जिसे मॉडल एक बार में देखता है। इसमें आपका प्रॉम्प्ट, चैट हिस्ट्री और मॉडल का आउटपुट शामिल होता है। यदि आप इस सीमा से अधिक जाते हैं, तो मॉडल बातचीत के पुराने हिस्सों को भूल जाता है।
प्रॉम्प्ट्स से एजेंट्स (agents) की ओर बढ़ना
मॉडल को एक सिंगल प्रॉम्प्ट भेजना एक शुरुआत है। आप टेक्स्ट का सारांश बना सकते हैं या त्रुटियों (errors) को समझा सकते हैं। हालाँकि, एक बेसिक LLM की कुछ सीमाएँ होती हैं:
- यह आपके डेटाबेस या APIs को कॉल नहीं कर सकता।
- यह अनुरोधों (requests) के बीच चीजों को याद नहीं रखता है।
- यह तथ्य गढ़ सकता है (invent facts)।
वास्तविक उत्पाद बनाने के लिए, आपको एजेंट्स की आवश्यकता होती है। एक एजेंट LLM में तीन चीजें जोड़ता है:
- Tools: वेब सर्च या कैलकुलेटर जैसे फंक्शन्स।
- Memory: पिछली बातचीत और यूजर डेटा के लिए स्टोरेज।
- Orchestration: यह तय करने का लॉजिक कि किस टूल का उपयोग कब करना है और कब रुकना है।
एक साधारण LLM केवल एक उत्तर देता है। एक एजेंट एक लक्ष्य लेता है और विश्वसनीय परिणाम तक पहुँचने के लिए टूल्स और मेमोरी का उपयोग करता है।
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi