AI एजंटचा सर्वात कठीण भाग म्हणजे 'अनहॅपी पाथ' (Unhappy Path) आहे

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial१४ तासांपूर्वी2min read

AI एजंटचा सर्वात कठीण भाग म्हणजे 'अनहॅपी पाथ' (Unhappy Path) आहे

AI एजंटमधील सर्वात कठीण भाग म्हणजे 'अनहॅपी पाथ' (Unhappy Path)

बहुतेक AI एजंट डेमोमध्ये एक आदर्श परिस्थिती दाखवली जाते. एक स्पष्ट प्रश्न आणि त्याचे अचूक उत्तर. सर्वजण टाळ्या वाजवतात.

खरी इंजिनीअरिंग तेव्हा घडते जेव्हा गोष्टी बिघडतात.

जेव्हा एखादी API बंद पडते तेव्हा काय होते? जेव्हा एखादा एजंट सतत लूपमध्ये अडकून पडतो आणि तुमच्या क्रेडिट कार्डमधील पैसे संपवून टाकतो तेव्हा काय होते? जेव्हा एजंटकडे डेटा नसतो पण तरीही तो असा रिपोर्ट लिहितो जो अगदी खरा वाटतो, तेव्हा काय होते?

जीनोमिक्समधील (genomics) या समस्या सोडवण्यासाठी मी BioAgent तयार केले आहे. हे एक स्वायत्त (autonomous) विश्लेषक आहे जे डेटा गोळा करते, PubMed वर शोध घेते आणि क्लिनिकल रिपोर्ट्स लिहिते.

हे तयार करण्यासाठी मी LangGraph आणि Claude वापरले. अपयशासाठी (failure) सिस्टीम तयार करण्याबाबत मी काय शिकलो, ते खालीलप्रमाणे आहे.

प्रत्येक लूपला मर्यादा द्या (Bound every loop) एजंटसाठी एक 'हार्ड रिट्राय लिमिट' (hard retry limit) असणे आवश्यक आहे. जर तुमचा एजंट सशुल्क (paid) APIs वापरत असेल, तर लूपमध्ये अडकणे हा एक आर्थिक धोका आहे. मर्यादा तेव्हाच काम करते जेव्हा तुम्ही प्रत्येक टप्प्यावर काउंटर (counter) वाढवता. जर तुम्ही कोडची ती एक ओळ विसरलात, तर सिस्टीम क्रॅश होईपर्यंत एजंट लूपमध्येच राहील.
यशाचे नाही, तर अपयशाचे परीक्षण करा (Test the failure, not the success) डेव्हलपमेंट दरम्यान 'हॅपी पाथ' (happy path) नेहमीच काम करतो. टेस्टिंग दरम्यान तुम्हाला तुमच्या डिपेंडन्सीजना (dependencies) मुद्दाम फेल करावे लागेल. जेव्हा एखादी API ऑफलाइन असते, तेव्हा एजंट लूपमध्ये अडकण्याऐवजी व्यवस्थित (gracefully) काम थांबवेल किंवा कमी कार्यक्षम होईल, याची खात्री देणारे टेस्ट केसेस लिहा.
आत्मविश्वासाने दिलेली चुकीची माहिती रोखा (Prevent confident nonsense) सर्वात मोठा धोका सिस्टीम क्रॅश होण्याचा नाही. खरा धोका म्हणजे असा रिपोर्ट जो व्यावसायिक वाटतो पण त्यात बनावट डेटा असतो. 'हॅलुसिनेशन' (hallucinations) थांबवण्यासाठी केवळ प्रॉम्प्ट सूचनांवर अवलंबून राहू नका. एजंटने कधीही स्वतःहून मेट्रिक्स (metrics) तयार करू नयेत, याची खात्री करण्यासाठी टेस्ट्सचा वापर करा.
तुमचे निकाल तथ्यांवर आधारित ठेवा (Ground your results) रिट्रिव्हल (Retrieval) तेव्हाच उपयुक्त ठरते जेव्हा मजकूर लेखकापर्यंत पोहोचतो. मला असे आढळले की पूर्ण अ‍ॅबस्ट्रॅक्ट्सऐवजी (abstracts) फक्त IDs पाठवल्यामुळे मॉडेलने स्वतःहून संबंध जोडण्यास सुरुवात केली. रिपोर्ट तथ्यांवर आधारित राहील याची खात्री करण्यासाठी तुम्हाला मॉडेलला प्रत्यक्ष मजकूर पाठवावा लागेल.

प्रॉम्प्टमधील नियम ही एक आशा आहे. टेस्टमधील नियम ही एक खात्री आहे.

'अनहॅपी पाथ'साठी सिस्टीम तयार करा. कारण प्रत्यक्षात तोच भाग महत्त्वाचा असतो.

Source: https://dev.to/gbadedata/the-hardest-part-of-an-autonomous-ai-agent-is-the-unhappy-path-3p2c

Optional learning community: https://t.me/GyaanSetuAi

AI एजंटचा सर्वात कठीण भाग म्हणजे 'अनहॅपी पाथ' (Unhappy Path) आहे

Continue reading

AI एजंट्समध्ये विश्वासार्हतेची समस्या आहे

तुमचा एजंट डेमो काम करतोय. हाच तो सापळा आहे.

AI एजंट्समधील कठीण भाग कृती करणे नसून, नियोजन करणे हा आहे

सर्वात चर्चेत असलेल्या AI फ्रेमवर्कमध्ये एक गंभीर त्रुटी आहे