Bagaimana Saya Mengendalikan Pelbagai Aplikasi Secara Bersendirian: The Agent Harness

Translated for your language. Read the original.

AI-assisted draft.

Bagaimana Saya Mengendalikan Pelbagai Aplikasi Secara Bersendirian: The Agent Harness

Bagaimana Saya Mengendalikan Pelbagai Aplikasi Secara Solo: The Agent Harness

Saya membina dan menyelenggara beberapa aplikasi kecil sendirian. Saya tidak mempunyai pengasas bersama, pekerja, mahupun kontraktor. Saya menggunakan seorang manusia dan sekumpulan ejen AI.

Orang ramai menyangka AI membantu saya mengekod dengan lebih pantas. Itu bukan rahsianya.

Rahsianya ialah saya tidak pernah membiarkan AI menganggap sesuatu tugasan selesai tanpa bukti. Apabila anda bekerja sendirian, bahayanya bukanlah kerja yang lambat. Bahayanya ialah menjadi salah dengan penuh keyakinan.

AI akan memberitahu anda bahawa ujian lulus walaupun ia tidak pernah menjalankannya. Ia akan mengatakan sesuatu ciri telah siap sedangkan ia hanya menulis nama fungsi. Tanpa rakan sekerja untuk mengesan kesilapan, satu jawapan "nampak baik" yang salah boleh merosakkan aplikasi anda.

Saya membina satu sistem yang dipanggil the harness. Ia menjadikan penyelesaian palsu sebagai sesuatu yang "mahal". Ia menggunakan ejen khusus dan pintu pengesahan (verification gates) untuk memastikan AI menyatakan kebenaran.

Berikut adalah cara ia berfungsi:

• Ejen Khusus: Daripada menggunakan satu pembantu, saya menggunakan empat puluh ejen khusus. Seorang menyemak kod Flutter. Seorang menyemak keselamatan. Seorang menjalankan ujian. Seorang melakukan audit realiti dengan membandingkan dakwaan terhadap perubahan sebenar. • Kerja Terasing: Ejen bekerja dalam persekitaran sementara yang berasingan. Mereka tidak boleh menindih kerja satu sama lain. • Redundansi: Saya menggunakan beberapa penyemak untuk satu perubahan. Seorang penyemak mungkin terlepas pandang pepijat (bug). Tiga penyemak dengan matlamat berbeza ditambah dengan seorang skeptik akan menemuinya. • Saluran Paip Tetap (Fixed Pipelines): Setiap tugasan mengikut laluan yang ketat:

Rancang tugasan.
Laksanakan perubahan.
Jalankan kod secara nyata. Saya tidak menerima "Saya rasa ia berfungsi." Saya hanya menerima output sebenar.
Audit realiti. Ejen berasingan menyemak sama ada kod tersebut sepadan dengan dakwaan.
Semakan. Seorang pakar bahasa menyemak hasil kerja.
Pintu pengesahan (Verify gate). Langkah terakhir menyemak perubahan sebenar dan kebocoran keselamatan. Ia akan mengembalikan PASS atau REJECT.

Sistem ini menghentikan penipuan yang sering saya lakukan terhadap diri sendiri.

"Ia sepatutnya berfungsi" gagal pada peringkat pelaksanaan. "Selesai" gagal pada audit realiti jika kod tersebut hanyalah kerangka kosong. "Semua hijau" gagal jika terdapat amaran yang tersembunyi.

Saya juga menggunakan sistem memori tiga lapisan. Ia menggunakan indeks pendek, nota jangka panjang, dan carian teks penuh. Ini menghalang AI daripada meneka bagaimana saya menetapkan sesuatu pada masa lalu.

Peraturan yang paling penting ialah ini: Saya mengautomasikan kerja, tetapi saya tidak pernah mengautomasikan pertimbangan (judgment).

• Penerbitan adalah manual. Saya menekan butang tersebut. • Pelancaran (Going live) memerlukan saya. Saya meluluskan setiap pembayaran atau tetapan pelancaran. • Tiada apa yang digabungkan (merge) jika berlaku kegagalan. Binaan (build) yang rosak akan menyekat segalanya.

Leveraj AI datang daripada pengautomasian tugasan. Keselamatan pula datang daripada keengganan untuk mengautomasikan keputusan.

Apabila anda bekerja sendirian, sumber anda yang paling berharga ialah kepercayaan. Anda mesti percaya bahawa apa yang anda hantar adalah apa yang anda niatkan untuk dihantar.

Mulakan secara kecil-kecilan. Cari kesilapan yang paling kerap anda lakukan. Bina satu semakan yang menjadikan kesilapan itu mustahil untuk berlaku.

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

Bagaimana Saya Mengendalikan Pelbagai Aplikasi Secara Bersendirian: The Agent Harness

Continue reading

Demo Ejen Anda Berfungsi. Itulah Perangkapnya.

Membina Persekitaran Ujian Ejen AI Sebelum Produksi