𝗠𝗮𝗻𝗶𝗳𝗲𝘀𝘁𝗼 𝗙𝘂𝗹𝗹𝗔𝗴𝗲𝗻𝘁𝗶𝗰𝗦𝘁𝗮𝗰𝗸
Semua orang sedang cuba membina ejen.
Orang ramai bercakap tentang prompt, alatan, dan LLM. Mereka fokus pada ejen yang memanggil API. Ini hanyalah permulaan.
Dalam beberapa tahun lagi, persoalannya akan berubah. Anda tidak akan bertanya bagaimana untuk membina sebuah ejen. Anda akan bertanya bagaimana untuk membina sistem yang boleh dipercayai yang terdiri daripada ejen-ejen.
Ejen bukanlah sebuah sistem. Ejen adalah satu bahagian daripada seni bina yang lebih besar.
Fasa perisian seterusnya memerlukan infrastruktur. Ejen, manusia, dan perkhidmatan mesti berinteraksi dengan kepercayaan, memori, dan bukti. Saya memanggilnya FullAgenticStack.
Membina ejen menjadi semakin mudah. Ini mewujudkan satu perangkap. Orang ramai berfikir perisian ejen hanyalah LLM ditambah dengan alatan dan memori.
Itu tidak mencukupi.
Chatbot dengan panggilan alatan (tool calling) bukanlah sebuah sistem. Rangkaian prompt bukanlah sebuah seni bina.
Masalah sebenar bukanlah membuat ejen melakukan tugasan sekali sahaja. Masalah sebenar adalah memastikan sistem ejen berfungsi dengan selamat dan berulang kali dalam dunia nyata.
Anda mesti menjawab soalan-soalan ini:
- Bagaimana anda mengorkestrasi ejen?
- Bagaimana anda mengautentikasi mereka?
- Bagaimana anda mengaudit tindakan mereka?
- Bagaimana anda mengehadkan kebenaran mereka?
- Bagaimana anda memulihkan keadaan (state) selepas kegagalan?
- Bagaimana anda mencegah huru-hara apabila ejen berkoordinasi?
Ini bukan masalah kecil. Ia adalah asasnya.
FullAgenticStack menyediakan persekitaran untuk perisian ejen berfungsi dalam produksi. Ia merangkumi:
- Identiti manusia dan ejen
- Pengesahan (authentication) dan kebenaran (authorization)
- Kebenaran dan keupayaan
- Keadaan (state) dan memori
- Sejarah peristiwa dan kebolehpemerhatian (observability)
- Pemulihan dan rollback
- Bukti pelaksanaan
- Interaksi sifar-kepercayaan (zero-trust)
Panggilan alatan hanyalah satu antara muka. Ia tidak menyelesaikan isu identiti. Ia tidak menyelesaikan isu tanggungjawab.
Jika ejen membeli produk, siapa yang memberi kebenaran? Jika ejen gagal, bagaimana anda memulihkannya? Jika ejen menyebabkan kemudaratan, bagaimana anda membuktikan apa yang telah berlaku?
Ini adalah keperluan kejuruteraan.
Web seterusnya akan terdiri daripada ejen yang bertindak bagi pihak manusia dan syarikat. Ejen akan berunding, menjadual, membeli, dan menjual.
Untuk ini berjaya, ejen tidak boleh menjadi skrip yang tidak kelihatan. Ia mesti boleh dikenal pasti, boleh diperhati, dan boleh dibuktikan.
Anda tidak memerlukan timbunan prompt (prompt stack). Anda memerlukan FullAgenticStack.
Berhenti melihat pada permukaan sahaja. Matlamatnya bukan sama ada ejen boleh memanggil alatan. Matlamatnya adalah sama ada ejen boleh wujud dalam sistem yang boleh dipercayai.
Ejen bukanlah pengakhiran. Ia adalah permulaan kepada seni bina yang baharu.
Manifesto FullAgenticStack: Ejen bukan sekadar LLM
Jika anda beranggapan bahawa ejen hanyalah sekadar satu prompt yang dihantar ke LLM, anda terlepas gambaran yang lebih besar.
Falasi Berpusatkan LLM
Ramai pembangun hari ini terperangkap dalam pemikiran bahawa LLM adalah ejen itu sendiri. Walaupun LLM adalah "otak" di sebalik ejen, ia bukanlah keseluruhan sistem. Menganggap LLM sebagai ejen adalah seperti menganggap otak manusia sebagai keseluruhan manusia. Otak boleh berfikir, tetapi tanpa deria, memori, dan anggota badan, ia tidak dapat bertindak dalam dunia nyata.
Apakah itu Ejen?
Ejen adalah sistem yang menggunakan LLM sebagai pusat penaakulan untuk mencapai matlamat tertentu melalui interaksi dengan persekitaran.
Untuk menjadi ejen yang berkesan, sistem tersebut memerlukan komponen berikut:
1. Memori
Ejen memerlukan keupayaan untuk menyimpan maklumat daripada interaksi masa lalu dan menggunakan semula maklumat tersebut untuk membuat keputusan yang lebih baik. Ini termasuk:
- Memori Jangka Pendek: Konteks dalam sesi perbualan semasa.
- Memori Jangka Panjang: Penyimpanan maklumat kekal menggunakan pangkalan data vektor atau storan luaran.
2. Perancangan
Ejen mesti mampu memecahkan matlamat yang kompleks kepada langkah-langkah yang boleh dilaksanakan. Ini melibatkan:
- Penyahpecahan Tugas: Memecahkan tugasan besar kepada sub-tugasan.
- Refleksi Diri: Menilai semula pelan dan membetulkan kesilapan semasa proses pelaksanaan.
3. Penggunaan Alatan (Tool Use)
Ejen tidak boleh hanya bercakap; ia mesti boleh bertindak. Ini bermakna mempunyai akses kepada API, pangkalan data, pelayar web, atau kod pengaturcaraan untuk melaksanakan tugas di dunia nyata.
4. Persepsi
Ejen perlu "melihat" atau "mendengar" persekitarannya. Ini boleh jadi melalui input teks, imej, atau data sensor untuk memahami keadaan semasa sebelum membuat tindakan seterusnya.
5. Tindakan
Ini adalah hasil akhir—keupayaan untuk melaksanakan perubahan dalam persekitaran, seperti menghantar e-mel, menulis fail, atau mengemas kini pangkalan data.
Lapisan FullAgenticStack
Manifesto kami mencadangkan pendekatan berlapis untuk membina ejen yang teguh:
| Lapisan | Fungsi |
|---|---|
| Lapisan Model | Menyediakan keupayaan penaakulan asas (LLM). |
| Lapisan Memori | Menguruskan konteks dan penyimpanan maklumat jangka panjang. |
| Lapisan Perancangan | Menguruskan strategi, pecahan tugas, dan logik penyelesaian masalah. |
| Lapisan Alatan | Menyediakan antaramuka untuk berinteraksi dengan dunia luar. |
| Lapisan Orkestrasi | Menghubungkan semua lapisan untuk memastikan aliran kerja yang lancar. |
Kesimpulan
Masa depan kecerdasan buatan bukan terletak pada pembinaan LLM yang lebih besar, tetapi pada pembinaan sistem ejen yang lebih pintar, berautonomi, dan berintegrasi. Dengan memahami bahawa ejen adalah satu stack (timbunan) teknologi dan bukan sekadar satu model, kita boleh mula membina penyelesaian yang benar-benar mampu mengubah dunia.