Membangun Agen AI Spesialis

Satu agen AI raksasa terdengar mudah. Anda memberinya satu perintah untuk menulis kode, menjalankan pengujian, meninjau keamanan, dan memperbarui dokumentasi.

Ini berhasil untuk demo. Namun, ini gagal dalam rekayasa nyata.

Agen tunggal sering kali menjadi lemah karena pekerjaan perangkat lunak membutuhkan cara berpikir yang berbeda. Menulis kode tidak sama dengan mengujinya. Meninjau kode tidak sama dengan mendokumentasikannya.

Tim rekayasa yang sebenarnya memisahkan tugas-tugas ini. Arsitektur AI Anda pun harus melakukan hal yang sama.

Agen spesialis bekerja lebih baik karena mereka memiliki tugas yang sempit. Tugas yang sempit mudah untuk didefinisikan:

  • Apa yang dapat mereka baca
  • Apa yang dapat mereka edit
  • Perintah apa yang dapat mereka jalankan
  • Kapan mereka harus berhenti

Berikut adalah cara menyusun tim spesialis:

• Agen Developer Tugasnya adalah melakukan perubahan kode yang kecil dan aman. Ia mengikuti kriteria penerimaan yang ketat dan hanya menyentuh file yang diizinkan.

• Agen Tester Tugasnya adalah merusak sesuatu. Ia tidak mencoba membuat kode terlihat bagus. Ia membuktikan bahwa perilakunya berfungsi. Seorang tester yang baik melaporkan apa yang tidak dapat ia verifikasi.

• Agen Reviewer Tugasnya adalah menciptakan hambatan. Ia memeriksa apakah penamaan sudah jelas, apakah ada logika yang duplikat, atau apakah perubahannya terlalu besar.

• Agen Security Tugasnya adalah bersikap skeptis. Ia mencari celah otorisasi, SQL injection, atau kebocoran data sensitif. Ia harus bersifat read-only untuk mencegah perubahan yang diam-diam dan tidak terverifikasi.

• Agen Dokumentasi Tugasnya adalah mengubah perubahan kode menjadi panduan manusia. Ia memperbarui file README, contoh API, dan changelog. Ini sering kali menjadi hal pertama yang dilupakan manusia.

• Agen Orchestrator Tugasnya adalah mengelola alur kerja. Ia membagi tugas, menugaskan agen, meneruskan konteks, dan memeriksa persetujuan. Ia tidak melakukan pekerjaan tersebut; ia mengarahkan pekerjaan tersebut.

Saat agen saling mengoper tugas, gunakan data terstruktur alih-alih paragraf panjang. Gunakan JSON atau artefak bertipe. Hal ini memudahkan agen berikutnya untuk bertindak dan memudahkan Anda untuk memeriksa pekerjaannya.

Agen yang kecil dan terfokus lebih mudah dikendalikan daripada satu model masif. Tim spesialis akan tetap tangguh dalam lingkungan produksi.

Sumber: https://dev.to/nazar_boyko/creating-specialized-ai-agents-developer-tester-reviewer-documenter-4ac2

Komunitas belajar opsional: https://t.me/GyaanSetuAi