Pelan Rollback Ejen AI: Batalkan Tindakan Salah Sebelum Pengguna Hilang Kepercayaan

Ejen AI yang boleh dipercayai tidak perlu menjadi sempurna. Ia perlu tahu cara untuk berhenti, menjelaskan kesilapannya, dan pulih semula.

Jika ejen anda mengemas kini medan CRM yang salah atau menghantar pembayaran pendua, cubaan semula (retry) yang mudah tidak akan membaiki kerosakan tersebut. Anda memerlukan pelan rollback sebelum berhadapan dengan insiden sebenar.

Apabila ejen beralih daripada sekadar sembang kepada kerja sebenar, mereka kini mengubah keadaan (mutate state). Ini menjadikan rollback sebagai ciri produk, bukan sekadar tugasan backend.

Mod kegagalan biasa:

  • Ejen menggunakan ID rekod yang salah.
  • Cubaan semula mengulang tindakan sebanyak dua kali.
  • Pertukaran model mengubah cara alat (tool) berfungsi.
  • Aliran kerja (workflow) bersambung semula dengan memori lama.
  • Urutan separa meninggalkan data yang tidak konsisten.

Cara membina lapisan pemulihan:

  1. Gunakan Lejar Tindakan (Action Ledger) Jangan bergantung pada log sahaja. Cipta satu lejar yang merekodkan setiap perubahan keadaan. Setiap panggilan alat (tool call) mesti mencipta entri sebelum dan selepas pelaksanaan. Ini adalah sumber kebenaran (source of truth) anda untuk pemulihan.

  2. Klasifikasikan Tindakan Anda Bukan semua tindakan adalah sama.

  • Baca-sahaja (Read-only): Tiada rollback diperlukan.
  • Kemas kini dalaman: Pulihkan nilai sebelumnya daripada snapshot.
  • Luaran yang boleh diundur: Padam acara tersebut atau kemas kini status.
  • Luaran yang tidak boleh diundur: Gunakan pampasan (compensation) dan bukannya "undo" yang sebenar. Untuk e-mel atau pembayaran, anda tidak boleh "membatalkan penghantaran". Anda mesti menghantar pembetulan atau bayaran balik.
  1. Tegaskan Idempotensi (Idempotency) Model tidak menegaskan idempotensi. Masa larian alat (tool runtime) anda mesti melakukannya. Gunakan kunci idempotensi untuk memastikan jika ejen mencuba semula sesuatu tugasan, ia tidak mencipta kesan sampingan yang pendua.

  2. Gunakan Corak Saga (Saga Pattern) Untuk aliran kerja yang panjang, setiap tindakan ke hadapan memerlukan tindakan pampasan.

  • Cipta tugasan? Pampasannya adalah dengan memadam atau membatalkannya.
  • Kemas kini medan? Pampasannya adalah dengan memulihkan nilai lama.
  • Hantar e-mel? Pampasannya adalah dengan menghantar pembetulan.
  1. Laksanakan Titik Semak (Checkpoints) Berhenti meminta model untuk "mencari tahu di mana kita berada" selepas kegagalan (crash). Gunakan titik semak untuk menyimpan keadaan semasa, tindakan yang telah selesai, dan tugasan yang tertunda. Sistem harus memuatkan titik semak tersebut untuk menyambung semula kerja.

  2. Bina Barisan Pemulihan (Recovery Queue) Apabila langkah pengesahan gagal, pindahkan tugasan ke barisan pemulihan. Ini membolehkan anda menyambung semula, memberi pampasan, atau menutup tugasan tersebut. Untuk ralat berisiko tinggi, sentiasa minta kelulusan manusia.

Kepercayaan dibina melalui pemulihan yang nyata. Apabila ejen melakukan kesilapan, jangan gunakan bahasa yang samar-samar. Beritahu pengguna dengan tepat apa yang berubah, mengapa ia berlaku, dan bagaimana anda memperbaikinya.

Bina pelan rollback anda sebelum insiden pertama berlaku.

Sumber: https://dev.to/jackm-singularity/ai-agent-rollback-plan-undo-bad-actions-before-users-lose-trust-4927

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi