AI एजंट्समधील कठीण भाग काम करणे नाही, तर नियोजन करणे आहे
कार्य पूर्ण करणारा AI एजंट तयार करणे सोपे आहे. पण त्यांचे योग्य नियोजन करणारा एजंट तयार करणे कठीण आहे.
मी एक CLI तयार केले आहे जिथे तुम्ही एक वाक्य टाईप करता आणि एक LLM तुमच्या वास्तविक खात्यांवर (accounts) कृती करते. मी दोन मोड वापरतो: Direct mode आणि Plan mode.
Direct mode हा वेगासाठी आहे. Plan mode हा सुरक्षिततेसाठी आहे. Plan mode मध्ये, एजंट तुमच्या डेटाला स्पर्श करण्यापूर्वी तुम्हाला प्रत्येक पायरी दाखवतो.
मी एक विश्वसनीय प्लॅनर (planner) कसा तयार केला, ते खालीलप्रमाणे आहे:
• Split the brain एकच एजंट नियोजन आणि अंमलबजावणी (execution) दोन्ही करू शकत नाही. नियोजन करणारा एजंट विचार करू इच्छितो. अंमलबजावणी करणारा एजंट कृती करू इच्छितो. मी त्यांना दोन वेगवेगळ्या सिस्टम प्रॉम्प्ट्ससह (system prompts) दोन वेगवेगळ्या एजंट्समध्ये विभागले आहे. यामुळे ते एकमेकांशी संघर्ष करणे थांबते.
• Give the agent eyes अंदाज लावणारा प्लॅनर धोकादायक असतो. माझ्या पहिल्या आवृत्तीने गृहितकांवर आधारित योजना तयार केल्या होत्या. आता, प्लॅनर प्रथम तुमच्या डेटाचा शोध घेण्यासाठी 'read-only' टूल्स वापरतो. एकही पायरी लिहिण्यापूर्वी तो तुमचे प्रत्यक्ष Salesforce फील्ड्स तपासतो.
• Prefill the answers एजंट्स अनेकदा चुकीचे प्रश्न विचारतात. जर त्यांनी खूप प्रश्न विचारले, तर शेवटी तुम्हालाच त्यांच्यासाठी काम करावे लागते. मी हे बदलले आहे. प्लॅनर अजूनही प्रश्न विचारतो, परंतु तो एक शिफारस केलेले उत्तर (recommended answer) देखील देतो. तुम्हाला फक्त ते कन्फर्म करायचे किंवा त्यात सुधारणा करायची आहे. यामुळे मॅन्युअल डेटा एंट्री न करता योजना अचूक राहते.
• Pass the context, not just the list जर तुम्ही अंमलबजावणी करणाऱ्याला (executor) फक्त पायऱ्यांची यादी दिली, तर तो त्यामागचे तर्क (reasoning) गमावतो. मी प्लॅनरला पायऱ्यांसोबतच गृहितके आणि धोके देखील पाठवण्यास सांगितले आहे. आता अंमलबजावणी करणाऱ्याला प्रत्येक कृतीमागील "का" (why) माहित असते.
• Label the danger जोपर्यंत तुम्हाला धोके दिसत नाहीत, तोपर्यंत योजना सुरक्षित नसते. माझी प्रणाली डिलीट करणे किंवा नाव बदलणे यांसारख्या विनाशकारी (destructive) कृतींना चिन्हांकित करते. जेव्हा एजंट एखाद्या विनाशकारी पायरीवर पोहोचतो, तेव्हा तो थांबतो आणि तुम्हाला विचारतो.
• Use data as the tiebreaker जर एजंटला वाटले की एखादी पायरी अयशस्वी झाली आहे आणि तुम्ही त्याला पुन्हा प्रयत्न करण्यास सांगितले, तर तो आंधळेपणाने आज्ञा पाळत नाही. तो प्रत्यक्ष प्लॅटफॉर्म डेटा तपासतो. जर डेटा दर्शवत असेल की कार्य आधीच पूर्ण झाले आहे, तर एजंट तुमच्या दाव्यापेक्षा डेटावर विश्वास ठेवतो.
सुरक्षिततेबद्दलचे सत्य: Plan mode प्रॉम्प्ट इंजेक्शन (prompt injection) किंवा न पाहता "approve" वर क्लिक करणाऱ्या वापरकर्त्याला रोखत नाही. हे जबाबदारी "मॉडेलवर विश्वास ठेवण्यापासून" "मानवी पुनरावलोकनावर (review) विश्वास ठेवण्याकडे" वळवते.
रचना सुरक्षा कवच (guardrails) प्रदान करते, परंतु तुमचे पुनरावलोकन अंतिम सुरक्षा प्रदान करते.
Optional learning community: https://t.me/GyaanSetuAi
