Gelung Ejen Luaran: Membina Sistem AI pada 2026
Kejuruteraan perisian sedang berubah.
Jurutera yang paling produktif tidak lagi memberikan arahan (prompt) kepada model secara manual. Mereka mereka bentuk sistem yang memberikan arahan kepada model bagi pihak mereka. Mereka membina kerangka (harness). Mereka menulis gelung (loop).
Untuk membina AI tahap produksi, anda mesti memahami perbezaan antara dua gelung:
Gelung Dalaman Ini berada di dalam konteks model. LLM memanggil alatan, mendapat hasil, dan mengulanginya sehingga ia berfikir ia telah selesai. Ia berkuasa tetapi terhad oleh tetingkap konteks (context windows) dan hanyutan perhatian (attention drift).
Gelung Luaran Ini adalah kerangka (harness). Ia berada di luar konteks model. Ia adalah kod yang anda tulis untuk membungkus LLM. Ia menentukan sama ada kerja tersebut bagus, jika ia perlu dicuba semula, atau jika manusia perlu campur tangan.
Gelung luaran gred produksi memerlukan enam komponen ini:
- Barisan Tugasan (Task Queues): Gunakan Redis atau SQS untuk mengurus kerja. Ini memastikan tugasan terselamat daripada kegagalan sistem (crash) dan membolehkan pengehadan kadar (rate limiting).
- Pembina Konteks (Context Builders): Ini menyediakan arahan sistem (system prompt) dan kekangan. Konteks yang buruk membawa kepada iterasi yang buruk.
- Pengurusan Sesi (Session Management): Ini menjejaki sejarah perbualan supaya ejen tidak hilang jejak.
- Isyarat Penyelesaian (Completion Signals): Anda memerlukan cara untuk mengetahui bila perlu berhenti. Gunakan ujian mekanikal, pemprosesan JSON (JSON parsing), atau LLM-sebagai-hakim (LLM-as-judge).
- Penguat Bajet (Budget Enforcers): Tetapkan had keras pada iterasi dan token untuk mengelakkan gelung infiniti yang membazirkan wang.
- Pengkomit (Committers): Ini adalah sempadan yang menulis output akhir ke dalam fail atau permintaan tarik (pull request).
Gunakan LLM-sebagai-hakim untuk tugasan yang tidak dapat dikesan oleh ujian. Gunakan model yang pantas dan murah untuk menilai output model penaakulan (reasoning model) anda yang mahal. Ini adalah peruntukan pengkomputeran yang cekap.
Berhati-hati dengan perangkap hutang seni bina (architecture debt).
LLM sering cuba membaiki ralat dengan menambah kod defensif seperti blok try/except. Jika gelung berjalan berkali-kali, ia boleh memenuhkan kod asas (codebase) anda dengan penyelesaian sandaran (fallbacks) yang berserabut. Sebaliknya, arahkan ejen anda untuk membaiki punca utama dan mengekalkan invarian sistem.
Matlamatnya bukanlah autonomi maksimum. Matlamatnya adalah membina gelung yang kekal boleh diselenggara dan difahami oleh manusia.
Bina gelung anda dengan sengaja.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
