Agent-R: लँग्वेज मॉडेल एजंट्सना आत्मपरीक्षण करण्यासाठी प्रशिक्षित करणे
लँग्वेज मॉडेल एजंट्सकडून अनेकदा चुका होतात. ते सूचनांचे पालन करतात, परंतु कामे कठीण झाल्यावर अपयशी ठरतात.
Agent-R ही समस्या सोडवते. एजंट्सना आत्मपरीक्षण (reflect) कसे करायचे हे शिकवण्यासाठी ती iterative self-training चा वापर करते.
ही प्रक्रिया तीन टप्प्यांत कार्य करते:
- एजंट एखादे काम पूर्ण करतो.
- एजंट चुका शोधण्यासाठी स्वतःच्या कामाचे परीक्षण करतो.
- एजंट आपल्या पुढील प्रयत्नांमध्ये सुधारणा करण्यासाठी या दुरुस्त्यांचा वापर करतो.
ही पद्धत अधिक चांगली तर्कशक्ती (reasoning) विकसित करते. एजंटला सतत मानवी मदतीची गरज न पडता तो स्वतःच्या चुकांमधून शिकतो.
स्वयंचलित सुधारणा (Self-correction) एजंट्सना जटिल वर्कफ्लोसाठी अधिक विश्वसनीय बनवते. हे आपल्याला अशा स्वायत्त प्रणालींच्या (autonomous systems) जवळ घेऊन जाते ज्या स्वतःच्या चुका स्वतःच सुधारू शकतात.
Optional learning community: https://t.me/GyaanSetuAi