Cara Saya Menjalankan Banyak Aplikasi Sendirian: The Agent Harness

Saya membangun dan mengelola beberapa aplikasi kecil sendirian. Saya tidak punya cofounder, tidak punya karyawan, dan tidak punya kontraktor. Saya menggunakan satu orang dan sekelompok agen AI.

Orang-orang mengira AI membantu saya coding lebih cepat. Itu bukan rahasianya.

Rahasianya adalah saya tidak pernah membiarkan AI menyatakan sebuah tugas selesai tanpa bukti. Saat Anda bekerja sendirian, bahayanya bukanlah pekerjaan yang lambat. Bahayanya adalah menjadi salah dengan penuh percaya diri.

AI akan memberi tahu Anda bahwa pengujian berhasil meskipun ia tidak pernah menjalankannya. Ia akan mengatakan sebuah fitur sudah selesai padahal ia hanya menulis nama fungsi. Tanpa rekan kerja untuk menangkap kesalahan, satu pernyataan "terlihat bagus" yang salah dapat merusak aplikasi Anda.

Saya membangun sebuah sistem yang disebut harness. Sistem ini membuat penyelesaian palsu menjadi mahal. Ia menggunakan agen-agen khusus dan gerbang verifikasi untuk memastikan AI mengatakan yang sebenarnya.

Berikut cara kerjanya:

• Agen Khusus: Alih-alih satu asisten, saya menggunakan empat puluh agen khusus. Satu meninjau kode Flutter. Satu memeriksa keamanan. Satu menjalankan pengujian. Satu melakukan audit realitas dengan membandingkan klaim terhadap perubahan aktual. • Pekerjaan Terisolasi: Agen bekerja di lingkungan sementara yang terpisah. Mereka tidak dapat menimpa satu sama lain. • Redundansi: Saya menggunakan beberapa peninjau untuk satu perubahan. Satu peninjau mungkin melewatkan bug. Tiga peninjau dengan tujuan berbeda ditambah seorang skeptis akan menemukannya. • Pipeline Tetap: Setiap tugas mengikuti jalur yang ketat:

  • Merencanakan tugas.
  • Mengimplementasikan perubahan.
  • Menjalankan kode secara nyata. Saya tidak menerima "Saya rasa ini berhasil." Saya hanya menerima output aktual.
  • Audit realitas. Agen terpisah memeriksa apakah kode sesuai dengan klaim.
  • Peninjauan. Seorang ahli bahasa memeriksa pekerjaan tersebut.
  • Gerbang verifikasi. Pemeriksaan terakhir untuk melihat perubahan nyata dan kebocoran keamanan. Ia mengembalikan PASS atau REJECT.

Sistem ini menghentikan kebohongan yang biasa saya katakan pada diri sendiri.

"Seharusnya berhasil" gagal pada tahap eksekusi. "Selesai" gagal pada audit realitas jika kodenya hanyalah cangkang kosong. "Semua hijau" gagal jika ada peringatan yang tersembunyi.

Saya juga menggunakan sistem memori tiga lapis. Sistem ini menggunakan indeks pendek, catatan jangka panjang, dan pencarian teks lengkap. Ini mencegah AI menebak-nebak bagaimana saya mengatur segala sesuatunya di masa lalu.

Aturan yang paling penting adalah ini: Saya mengotomatiskan pekerjaan, tetapi saya tidak pernah mengotomatiskan penilaian.

• Publikasi dilakukan secara manual. Saya yang menekan tombolnya. • Meluncurkan secara live membutuhkan saya. Saya menyetujui setiap pembayaran atau pengaturan rilis. • Tidak ada yang digabungkan jika terjadi kegagalan. Build yang rusak akan memblokir segalanya.

Daya ungkit (leverage) AI berasal dari otomatisasi tugas. Keamanannya berasal dari penolakan untuk mengotomatiskan keputusan.

Saat Anda bekerja sendirian, sumber daya Anda yang paling berharga adalah kepercayaan. Anda harus percaya bahwa apa yang Anda luncurkan adalah apa yang Anda maksudkan untuk diluncurkan.

Mulailah dari hal kecil. Temukan kesalahan yang paling sering Anda buat. Bangun satu pengecekan yang membuat kesalahan tersebut mustahil terjadi.

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi