AI एजंट्समधील कठीण भाग कृती करणे नसून, नियोजन करणे हा आहे

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialमागील आठवडा2min read

AI एजंट्समधील कठीण भाग कृती करणे नसून, नियोजन करणे हा आहे

AI एजंट्समधील कठीण भाग काम करणे नाही, तर नियोजन करणे आहे

कार्य पूर्ण करणारा AI एजंट तयार करणे सोपे आहे. पण त्यांचे योग्य नियोजन करणारा एजंट तयार करणे कठीण आहे.

मी एक CLI तयार केले आहे जिथे तुम्ही एक वाक्य टाईप करता आणि एक LLM तुमच्या वास्तविक खात्यांवर (accounts) कृती करते. मी दोन मोड वापरतो: Direct mode आणि Plan mode.

Direct mode हा वेगासाठी आहे. Plan mode हा सुरक्षिततेसाठी आहे. Plan mode मध्ये, एजंट तुमच्या डेटाला स्पर्श करण्यापूर्वी तुम्हाला प्रत्येक पायरी दाखवतो.

मी एक विश्वसनीय प्लॅनर (planner) कसा तयार केला, ते खालीलप्रमाणे आहे:

• Split the brain एकच एजंट नियोजन आणि अंमलबजावणी (execution) दोन्ही करू शकत नाही. नियोजन करणारा एजंट विचार करू इच्छितो. अंमलबजावणी करणारा एजंट कृती करू इच्छितो. मी त्यांना दोन वेगवेगळ्या सिस्टम प्रॉम्प्ट्ससह (system prompts) दोन वेगवेगळ्या एजंट्समध्ये विभागले आहे. यामुळे ते एकमेकांशी संघर्ष करणे थांबते.

• Give the agent eyes अंदाज लावणारा प्लॅनर धोकादायक असतो. माझ्या पहिल्या आवृत्तीने गृहितकांवर आधारित योजना तयार केल्या होत्या. आता, प्लॅनर प्रथम तुमच्या डेटाचा शोध घेण्यासाठी 'read-only' टूल्स वापरतो. एकही पायरी लिहिण्यापूर्वी तो तुमचे प्रत्यक्ष Salesforce फील्ड्स तपासतो.

• Prefill the answers एजंट्स अनेकदा चुकीचे प्रश्न विचारतात. जर त्यांनी खूप प्रश्न विचारले, तर शेवटी तुम्हालाच त्यांच्यासाठी काम करावे लागते. मी हे बदलले आहे. प्लॅनर अजूनही प्रश्न विचारतो, परंतु तो एक शिफारस केलेले उत्तर (recommended answer) देखील देतो. तुम्हाला फक्त ते कन्फर्म करायचे किंवा त्यात सुधारणा करायची आहे. यामुळे मॅन्युअल डेटा एंट्री न करता योजना अचूक राहते.

• Pass the context, not just the list जर तुम्ही अंमलबजावणी करणाऱ्याला (executor) फक्त पायऱ्यांची यादी दिली, तर तो त्यामागचे तर्क (reasoning) गमावतो. मी प्लॅनरला पायऱ्यांसोबतच गृहितके आणि धोके देखील पाठवण्यास सांगितले आहे. आता अंमलबजावणी करणाऱ्याला प्रत्येक कृतीमागील "का" (why) माहित असते.

• Label the danger जोपर्यंत तुम्हाला धोके दिसत नाहीत, तोपर्यंत योजना सुरक्षित नसते. माझी प्रणाली डिलीट करणे किंवा नाव बदलणे यांसारख्या विनाशकारी (destructive) कृतींना चिन्हांकित करते. जेव्हा एजंट एखाद्या विनाशकारी पायरीवर पोहोचतो, तेव्हा तो थांबतो आणि तुम्हाला विचारतो.

• Use data as the tiebreaker जर एजंटला वाटले की एखादी पायरी अयशस्वी झाली आहे आणि तुम्ही त्याला पुन्हा प्रयत्न करण्यास सांगितले, तर तो आंधळेपणाने आज्ञा पाळत नाही. तो प्रत्यक्ष प्लॅटफॉर्म डेटा तपासतो. जर डेटा दर्शवत असेल की कार्य आधीच पूर्ण झाले आहे, तर एजंट तुमच्या दाव्यापेक्षा डेटावर विश्वास ठेवतो.

सुरक्षिततेबद्दलचे सत्य: Plan mode प्रॉम्प्ट इंजेक्शन (prompt injection) किंवा न पाहता "approve" वर क्लिक करणाऱ्या वापरकर्त्याला रोखत नाही. हे जबाबदारी "मॉडेलवर विश्वास ठेवण्यापासून" "मानवी पुनरावलोकनावर (review) विश्वास ठेवण्याकडे" वळवते.

रचना सुरक्षा कवच (guardrails) प्रदान करते, परंतु तुमचे पुनरावलोकन अंतिम सुरक्षा प्रदान करते.

Source: https://dev.to/abdullahsaad5/the-hard-part-of-my-ai-agent-wasnt-doing-the-work-it-was-planning-it-n0k

Optional learning community: https://t.me/GyaanSetuAi

AI एजंट्समधील कठीण भाग कृती करणे नसून, नियोजन करणे हा आहे

Continue reading

एजेंटिक एआय सिस्टम्सचे परीक्षण

विशेषीकृत एआय एजंट्स तयार करणे

एंटरप्राइझ एआय एजंट्सना कंट्रोल प्लेनची गरज आहे

तुमच्या एजंट्सना प्रॉम्प्ट करणे थांबवा. त्यांचे नेतृत्व करायला सुरुवात करा.

एका AI एजंटच्या आत