Bertanya vs Mendelegasikan Ejen AI
Kebanyakan pembangun menggunakan AI seperti versi Stack Overflow yang lebih pintar.
Anda menaip soalan. Anda mendapat jawapan. Kemudian anda melakukan kerja itu sendiri. Kaedah ini perlahan.
Ada cara yang lebih pantas. Anda mesti berhenti bertanya dan mula mendelegasikan.
Apabila anda bertanya kepada AI: "Bagaimana saya mahu menulis ujian untuk modul auth saya?" Anda mendapat penjelasan. Anda masih perlu menulis ujian tersebut. Anda masih melakukan kerja itu.
Apabila anda mendelegasikan kepada ejen AI: "Tulis ujian untuk /src/auth.py. Merangkumi kes log masuk, log keluar, dan token tidak sah. Jalankannya. Jika ia gagal, baiki kod sehingga ia lulus. Beritahu saya apa yang anda telah ubah."
Ejen tersebut membuka fail anda. Ia menulis ujian. Ia menjalankannya. Ia membaca kegagalan. Ia membaiki kod. Ia membawakan anda set ujian yang berfungsi.
Anda menyemak hasilnya. Anda tidak melakukan kerja tersebut.
Delegasi yang berkesan memerlukan empat bahagian:
- Matlamat: Apakah yang perlu dihasilkan oleh ejen tersebut?
- Skop: Fail atau kawasan manakah yang perlu disentuh?
- Syarat kejayaan: Bagaimana kita tahu ia dilakukan dengan betul?
- Laporan balik: Apa yang telah diubah dan mengapa?
Contoh praktikal:
Debugging: "Cari punca utama ralat ini dan stack trace. Baiki ia dan jelaskan puncanya."
Refactoring: "Lakukan refactoring pada fail ini. Gunakan maksimum dua tahap sarang (nesting levels). Tiada fungsi yang lebih panjang daripada 30 baris. Kemas kini setiap tapak panggilan (call site)."
Migrasi pangkalan data: "Tulis skrip migrasi idempotent untuk perubahan skema ini. Jalankannya pada pangkalan data tempatan untuk mengesahkan ia berjaya."
Semakan (Reviewing): "Baca diff PR ini. Cari apa-apa yang boleh gagal dalam production. Tulis ujian yang saya terlepas."
Ejen adalah pantas. Mereka juga kadangkala salah. Gunakan tiga semakan ini untuk mengesahkan kerja mereka:
Adakah ia menyelesaikan masalah? Jalankan kod tersebut. Jangan sekadar membacanya. Laksanakan ujian. Menjalankan kod adalah satu-satunya cara untuk mencari kegagalan kes hujung (edge case).
Adakah ia sesuai dengan codebase anda? Ejen tidak mengetahui konvensyen pasukan anda. Imbas output untuk corak luar biasa atau perpustakaan (libraries) yang dielakkan oleh pasukan anda.
Adakah ia mengubah perkara di luar skop? Semak fail mana yang disentuh oleh ejen. Baca diff tersebut seperti PR daripada pembangun junior. Pastikan ia tidak merosakkan sesuatu semasa cuba membantu.
Tugas anda beralih daripada melakukan kerja kepada menentukan matlamat dan menyemak hasil. Anda memberikan pertimbangan. Ejen memberikan kepantasan.
Sumber: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
