AI Agent रोलबॅक प्लॅन: वापरकर्त्यांचा विश्वास गमावण्यापूर्वी चुकीच्या कृती मागे घ्या

एक विश्वसनीय AI agent ला परिपूर्ण असण्याची गरज नाही. त्याला कसं थांबायचं, आपली चूक कशी स्पष्ट करायची आणि त्यातून कसं सावरायचं (recover) हे माहित असणे आवश्यक आहे.

जर तुमच्या agent ने चुकीचे CRM field अपडेट केले किंवा दुप्पट पेमेंट पाठवले, तर केवळ 'retry' केल्याने नुकसान भरून निघणार नाही. प्रत्यक्ष घटना घडण्यापूर्वीच तुमच्याकडे रोलबॅक प्लॅन असणे आवश्यक आहे.

जसे agents चॅटिंगकडून प्रत्यक्ष कामाकडे वळत आहेत, ते आता 'state' मध्ये बदल (mutate) करत आहेत. यामुळे रोलबॅक ही केवळ बॅकएंडची प्रक्रिया न राहता एक 'product feature' बनली आहे.

सामान्य त्रुटी (Failure modes):

  • Agent चुकीचा record ID वापरते.
  • Retry मुळे एखादी कृती दोनदा होते.
  • मॉडेल बदलल्यामुळे टूलच्या कार्यपद्धतीत बदल होतो.
  • Workflow जुन्या मेमरीसह पुन्हा सुरू होतो.
  • अर्धवट क्रमांमुळे (partial sequence) डेटा विसंगत (inconsistent) राहतो.

रिकव्हरी लेअर (Recovery layer) कशी तयार करावी:

  1. Action Ledger वापरा केवळ logs वर अवलंबून राहू नका. प्रत्येक 'state change' नोंदवणारे एक ledger तयार करा. प्रत्येक tool call च्या अंमलबजावणीपूर्वी आणि नंतर त्याची नोंद असणे आवश्यक आहे. रिकव्हरीसाठी हेच तुमचे 'source of truth' असेल.

  2. तुमच्या कृतींचे वर्गीकरण करा (Classify Your Actions) प्रत्येक कृती सारखी नसते.

  • Read-only: रोलबॅकची गरज नाही.
  • Internal updates: snapshot मधून पूर्वीची व्हॅल्यू रिस्टोर करा.
  • External reversible: ती घटना (event) हटवा किंवा स्टेटस अपडेट करा.
  • External irreversible: खऱ्या अर्थाने 'undo' करण्याऐवजी 'compensation' (भरपाई) वापरा. ईमेल किंवा पेमेंटच्या बाबतीत, तुम्ही ते "un-send" करू शकत नाही. तुम्हाला सुधारणा किंवा रिफंड पाठवावा लागेल.
  1. Idempotency लागू करा मॉडेल idempotency लागू करत नाही. तुमच्या tool runtime ने ते करणे आवश्यक आहे. जर agent ने एखादे कार्य पुन्हा (retry) केले, तर त्याचे कोणतेही दुप्पट परिणाम (side effects) होणार नाहीत याची खात्री करण्यासाठी 'idempotency keys' वापरा.

  2. Saga Pattern वापरा लांब workflows साठी, प्रत्येक पुढच्या कृतीसाठी एक 'compensating action' (भरपाई देणारी कृती) आवश्यक असते.

  • टास्क तयार केला? तर त्याची भरपाई म्हणजे तो हटवणे किंवा रद्द करणे.
  • Field अपडेट केले? तर त्याची भरपाई म्हणजे जुनी व्हॅल्यू रिस्टोर करणे.
  • ईमेल पाठवला? तर त्याची भरपाई म्हणजे सुधारित माहिती पाठवणे.
  1. Checkpoints लागू करा क्रॅश झाल्यानंतर मॉडेलला "आपण कुठे होतो ते शोधून काढ" असे विचारणे थांबवा. सध्याची स्थिती (current state), पूर्ण झालेल्या कृती आणि प्रलंबित कार्ये (pending tasks) साठवण्यासाठी checkpoints वापरा. काम पुन्हा सुरू करण्यासाठी सिस्टमने checkpoint लोड केले पाहिजे.

  2. Recovery Queue तयार करा जेव्हा पडताळणीची (verification) पायरी अयशस्वी होते, तेव्हा ते कार्य recovery queue मध्ये हलवा. यामुळे तुम्हाला ते कार्य पुन्हा सुरू करणे, भरपाई देणे किंवा बंद करणे शक्य होईल. उच्च जोखमीच्या त्रुटींसाठी, नेहमी मानवी मंजुरी (human approval) घ्या.

विश्वास ही दृश्यमान रिकव्हरीद्वारे (visible recovery) निर्माण होतो. जेव्हा agent चूक करते, तेव्हा संदिग्ध भाषा वापरू नका. वापरकर्त्याला नेमके काय बदलले, ते का घडले आणि तुम्ही ते कसे सुधारले हे स्पष्टपणे सांगा.

पहिली घटना घडण्यापूर्वीच तुमचा रोलबॅक प्लॅन तयार ठेवा.

Source: https://dev.to/jackm-singularity/ai-agent-rollback-plan-undo-bad-actions-before-users-lose-trust-4927

Optional learning community: https://t.me/GyaanSetuAi