प्रोडक्शन एजंट लूप तयार करणे

📅2 hours ago⏱2 min read

प्रोडक्शन एजंट लूप तयार करणे

डेमो एजंट तयार करणे सोपे आहे. प्रोडक्शन एजंट तयार करणे कठीण आहे.

डेमोमध्ये, लूप साधे असते: निरीक्षण करा, निर्णय घ्या, कृती करा, तपासा आणि पुन्हा करा. मॉडेल निकाल पाहते आणि पुढच्या पायरीकडे जाते.

प्रोडक्शनमध्ये, त्याच लूपला कडक नियमांची आवश्यकता असते. प्रोडक्शन एजंट म्हणजे केवळ एक मॉडेल आणि काही टूल्स नसतात. ते प्रामाणिक राहण्यासाठी संरचनेत गुंफलेले एक लूप असते.

सर्वात मोठा सापळा म्हणजे टूल्सच्या प्रतिसादांवर (responses) विश्वास ठेवणे.

कल्पना करा की एका एजंटला ऑर्डर रद्द करायची आहे आणि रिफंड द्यायचा आहे.

एजंट cancel_order कॉल करतो.
टूल 200 OK परत करते.
एजंट लगेच issue_refund कॉल करतो.

डेमोमध्ये हे काम करते. प्रोडक्शनमध्ये, हे एक संकट ठरू शकते.

200 OK चा अर्थ अनेकदा असा असतो की विनंती स्वीकारली गेली आहे, याचा अर्थ असा नाही की काम पूर्ण झाले आहे. कॅन्सलेशन (रद्द करण्याची प्रक्रिया) अजूनही क्यू (queue) मध्ये प्रलंबित असू शकते. जर एजंटने कॅन्सलेशनची खात्री झाल्याशिवाय रिफंड दिला, तर तुम्ही केवळ गृहितकावर आधारित पैसे हस्तांतरित करता.

तुम्ही एक नियम पाळला पाहिजे: टूलचा प्रतिसाद विनंतीचे वर्णन करतो, जगाच्या (सध्याच्या स्थितीच्या) स्थितीचे नाही.

सुरक्षित प्रोडक्शन लूप तयार करण्यासाठी, तुम्हाला या घटकांची आवश्यकता आहे:

• टूल कॉन्ट्रॅक्ट्स (Tool Contracts): प्रत्येक टूलने त्याचे इनपुट, आउटपुट, फेल्युअर मोड्स (failure modes) आणि आयडेम्पोटन्सी की (idempotency key) परिभाषित केली पाहिजे. • व्हेरिफिकेशन गेट्स (Verification Gates): टूलने सक्सेस कोड परत केला आहे की नाही हेच तपासू नका. बदल झाला आहे की नाही याची खात्री करण्यासाठी जगाची (system state) प्रत्यक्ष स्थिती पुन्हा तपासा. • वर्किंग स्टेट (Working State): तथ्ये (facts) चॅट हिस्ट्रीपासून वेगळी ठेवा. यामुळे एजंट संभाषणाच्या मजकुराच्या आधारे चुकीची माहिती (hallucinating) देण्यापासून वाचतो. • अप्रूव्हल गेट्स (Approval Gates): उच्च-जोखीम असलेल्या कृतींसाठी मानवी संमती (sign off) घ्या. • स्टॉप रूल्स (Stop Rules): अनियंत्रित लूप्स रोखण्यासाठी स्टेप्स, खर्च, वेळ आणि शांततेवर (silence) मर्यादा सेट करा.

लूपची संरचना बदलत नाही. अंमलबजावणी अधिक कडक होते.

महत्त्वाच्या कृतींसाठी, तुमच्या "चेक" (check) पायरीमध्ये दोन भाग असणे आवश्यक आहे:

व्हेरिफाय (Verify): जग (system state) खरोखर अपेक्षेप्रमाणे बदलले का?
कमिट (Commit): आता एकदा खात्री झाली की, पुढच्या पायरीकडे जाणे सुरक्षित आहे का?

सर्वात सुरक्षित एजंट तो असतो ज्याच्यावर सर्वाधिक मर्यादा असतात. विश्वासार्हता मॉडेलला अधिक स्वातंत्र्य देण्यापासून नाही, तर त्याच्याभोवती स्पष्ट मर्यादा घालण्यापासून येते.

Source: https://dev.to/gursharansingh/ai-agents-in-practice-part-6-building-the-production-agent-loop-2lfi

Optional learning community: https://t.me/GyaanSetuAi

प्रोडक्शन एजंट लूप तयार करणे

Continue reading

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

एक स्वायत्त एजंट टीम तयार करणे

तुमचा AI एजंट सर्व चाचण्यांमध्ये यशस्वी झाला — पण प्रोडक्शनमध्ये अपयशी ठरला

ईमेल एजंट्ससाठी 'ह्युमन इन द लूप' डिझाइन

मॉडेल हे उत्पादन नाही. खरे उत्पादन काय आहे ते येथे पहा.