The Anatomy of an Agent Harness

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

GyaanSetu Editorialकल2मिनट पढ़ें

एक एजेंट हार्नेस की संरचना

आपने एक चैटबॉट बनाया। आपने कुछ टूल्स और एक साधारण लूप जोड़ा। यह डेमो के लिए तो काम करता है। फिर आप इसे प्रोडक्शन में ले जाने की कोशिश करते हैं और सब कुछ टूट जाता है।

मॉडल पिछले चरणों को भूल जाता है। टूल कॉल्स बिना किसी चेतावनी के विफल हो जाते हैं। कॉन्टेक्स्ट विंडो बेकार डेटा से भर जाती है।

समस्या आपका मॉडल नहीं है। समस्या इसके आसपास का इंफ्रास्ट्रक्चर है।

इस इंफ्रास्ट्रक्चर को एजेंट हार्नेस (agent harness) कहा जाता है।

एजेंट व्यवहार है। हार्नेस मशीनरी है। यदि आप मॉडल नहीं हैं, तो आप हार्नेस हैं।

एक रॉ (raw) LLM को CPU की तरह समझें। इसमें कोई RAM, कोई डिस्क और कोई I/O नहीं होता है। हार्नेस ऑपरेटिंग सिस्टम है। यह मॉडल को उपयोगी बनाने के लिए मेमोरी, टूल्स और लॉजिक प्रदान करता है।

एक प्रोडक्शन-ग्रेड हार्नेस के बारह मुख्य घटक होते हैं:

• ऑर्केस्ट्रेशन लूप (Orchestration Loop): यह धड़कन की तरह है। यह Thought-Action-Observation चक्र को प्रबंधित करता है। • टूल लेयर (Tool Layer): ये हाथ हैं। हार्नेस टूल रजिस्ट्रेशन, वैलिडेशन और एक्जीक्यूशन को संभालता है। • मेमोरी (Memory): इसमें शॉर्ट-टर्म हिस्ट्री और विभिन्न सेशन्स के बीच लॉन्ग-टर्म पर्सिस्टेंस शामिल है। • कॉन्टेक्स्ट मैनेजमेंट (Context Management): यह डेटा को कंपैक्ट या समराइज करके कॉन्टेक्स्ट रॉट (context rot) को रोकता है। • प्रॉम्प्ट असेंबली (Prompt Assembly): यह सटीक इनपुट तैयार करता है जिसे मॉडल प्रत्येक चरण में देखता है। • आउटपुट क्लासिफिकेशन (Output Classification): यह तय करता है कि मॉडल बात करना चाहता है या किसी टूल का उपयोग करना चाहता है। • स्टेट मैनेजमेंट (State Management): यह एजेंट को त्रुटि या रुकावट के बाद काम फिर से शुरू करने की अनुमति देता है। • एरर हैंडलिंग (Error Handling): यह विफलताओं को पकड़ता है ताकि त्रुटियां बढ़ती न जाएं। • गार्डरेल्स (Guardrails): ये असुरक्षित या गलत कार्यों को रोकने के लिए ट्रिपवायर के रूप में कार्य करते हैं। • परमिशन एनफोर्समेंट (Permission Enforcement): यह मॉडल जो करना चाहता है और जिसे करने की उसे अनुमति है, उसके बीच अंतर करता है। • वेरिफिकेशन लूप्स (Verification Loops): यह मॉडल को गुणवत्ता सुधारने के लिए अपने काम की स्वयं जांच करने देता है। • एजेंट हैंडऑफ्स (Agent Handoffs): यह प्रबंधित करता है कि एक एजेंट दूसरे को काम कैसे सौंपता है।

अच्छी इंजीनियरिंग का लक्ष्य हार्नेस को जितना संभव हो सके उतना हल्का (thin) रखना है। जैसे-जैसे मॉडल स्मार्ट होते जाएंगे, आपको कम स्कैफोल्डिंग (scaffolding) की आवश्यकता होगी।

जब आपका एजेंट विफल हो जाए, तो मॉडल को दोष न दें। अपने हार्नेस को देखें।

Source: https://dev.to/aniruddhaadak/the-anatomy-of-an-agent-harness-1n1j

Optional learning community: https://t.me/GyaanSetuAi

The Anatomy of an Agent Harness

पढ़ना जारी रखें

मॉडल ही उत्पाद नहीं है। असल में उत्पाद यह है।

𝗧𝗵𝗲 𝗩𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗧𝗲𝘀𝘁 𝗘𝘃𝗲𝗿𝘆 𝗔𝗜 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗙𝗮𝗶𝗹𝘀

अपने मॉडल को फाइन-ट्यून करना बंद करें। समस्या आपके आर्किटेक्चर में है।

एक AI एजेंट के भीतर