Agen Coding Saya Mengingat Sesi, Bukan Pekerjaan
Sebuah agen coding dapat menjaga thread tetap aktif namun tetap terasa pelupa.
Saya menghadapi masalah ini saat membangun CliGate. Saya telah memperbaiki kontinuitas sesi, tetapi tugas-tugas yang berulang tetap terasa terlalu lambat.
Agen tersebut mengingat percakapan, tetapi tidak mengingat pekerjaannya.
Kontinuitas sesi menyelesaikan satu masalah. Ini membantu perintah lanjutan seperti:
- continue
- do the same for this file
- retry that
Itu berguna. Namun, itu tidak membantu saat Anda mengulangi alur kerja beberapa hari kemudian.
Seorang agen perlu mengingat apa yang membuat eksekusi terakhir berhasil. Ia perlu mengetahui:
- tombol mana yang berfungsi
- langkah mana yang buntu
- kolom mana yang memerlukan penanganan khusus
- aturan mana yang selalu ingin Anda terapkan
Eksekusi pertama adalah yang paling mahal. Di situlah agen mengeksplorasi dan menemukan detail yang tidak ada dalam prompt Anda.
Sebelum perbaikan saya, detail-detail ini hanya tersimpan dalam log mentah. Agen tersebut memiliki riwayat, tetapi tidak memiliki memori yang dapat digunakan kembali. Ia harus menemukan kembali segalanya setiap saat.
Itu bukan kecerdasan. Itu adalah membayar biaya debugging yang sama dua kali.
Pendekatan yang salah adalah menyimpan lebih banyak riwayat dan berharap model akan menggunakannya. Hal itu justru menciptakan noise.
Sebagai gantinya, saya membangun lapisan memori yang lebih kecil dan dapat digunakan kembali. Saya fokus pada:
- prosedur
- fakta
- arahan
- referensi
Saya berhenti mencoba menyimpan segala sesuatu yang terjadi. Saya mulai menyimpan apa yang seharusnya diingat.
Sekarang, asisten tersebut menggunakan lapisan memori berbasis file untuk mengingat:
- sebuah prosedur: langkah-langkah terbaik dan jalan buntu yang diketahui
- sebuah fakta: URL atau pengaturan tertentu
- sebuah arahan: bagaimana Anda ingin segala sesuatunya dilakukan
- sebuah referensi: di mana dokumentasi berada
Beginilah cara manusia bekerja.
Saya tidak menginginkan pemutaran ulang masa lalu yang sempurna karena antarmuka berubah dan tombol berpindah posisi. Saya ingin agen tersebut:
- Mengingat prosedur terbaik yang diketahui
- Mencobanya terlebih dahulu
- Memverifikasi setiap langkah
- Kembali ke eksplorasi jika gagal
- Memperbarui memori setelah berhasil
Ini mengubah otomatisasi yang rapuh menjadi memori operasional yang berguna.
Saya juga memisahkan aturan tetap dari riwayat percakapan. Aturan seperti "selalu balas dalam bahasa Mandarin" atau "jangan menyentuh data produksi" bukanlah konteks sesi. Itu adalah aturan operasional.
Setelah saya memisahkan hal ini, asisten tersebut menjadi dapat diprediksi. Ia tidak perlu lagi menemukan kembali preferensi Anda di tengah-tengah tugas.
Tugas-tugas berulang kini menjadi lebih singkat. Asisten bergerak lebih cepat karena ia tidak memulai dengan model yang kosong setiap saat.
Jangan keliru menganggap thread yang berkelanjutan sebagai sistem yang belajar.
Sesi menjaga percakapan tetap hidup. Memori menjaga pelajaran yang berguna tetap hidup.
Jika Anda membangun agen coding, tanyakan pada diri sendiri: Apakah sistem Anda mengingat thread, atau ia mengingat prosedur yang berhasil?
Sumber: https://dev.to/codekingai/my-coding-agent-remembered-sessions-not-work-that-was-the-bug-2fig
