Mengapa Kebanyakan Ejen AI Terlalu Kompleks
Ejen AI ada di mana-mana. Anda melihat gerombolan ejen (agent swarms), pasukan autonomi, dan sistem yang menambah baik diri sendiri. Setiap minggu, rangka kerja (framework) baharu menjanjikan pembinaan generasi AI seterusnya.
Selepas mengkaji aliran kerja (workflow) AI, saya mempunyai satu kesimpulan mudah. Kebanyakan ejen AI adalah terlalu kompleks (overengineered).
Ejen bukanlah tidak berguna. Walau bagaimanapun, ramai pembangun menyelesaikan masalah dengan ejen sedangkan mereka boleh menggunakan sesuatu yang lebih ringkas.
Industri Menyukai Kerumitan
Bayangkan anda ingin membina sistem untuk membaca PDF, mengekstrak data, dan menjawab soalan. Ramai pembangun mencipta seni bina yang kompleks dengan enam ejen, pelbagai prom (prompts), dan pengurusan keadaan (state management). Ini menimbulkan banyak masalah.
Masalah yang sama sering kali boleh diselesaikan dengan urutan yang ringkas:
- PDF ke Chunk
- Chunk ke Embed
- Embed ke Vector DB
- LLM ke Respons
Kadangkala, aliran kerja sudah mencukupi. Anda tidak memerlukan tentera ejen.
Aliran Kerja Menyelesaikan Kebanyakan Masalah
Kebanyakan aplikasi AI adalah deterministik. Ia mengikut urutan yang ditetapkan. Contohnya termasuk:
- Soal Jawab Dokumen
- Sokongan pelanggan
- Ringkasan mesyuarat
- Penjanaan blog
- Semakan kod
Ini adalah aliran kerja, bukan sistem autonomi. Aliran kerja lebih mudah untuk dinyahpepijat (debug), diskalakan, diselenggara, dan dijelaskan.
Ejen Membawa Kos Tersembunyi
Setiap ejen baharu menambah isu:
- Kos token lebih tinggi akibat lebih banyak prom
- Latensi lebih tinggi akibat langkah tambahan
- Lebih banyak peluang untuk halusinasi
- Nyahpepijat (debugging) yang lebih sukar
- Keperluan infrastruktur yang lebih banyak
Aplikasi yang ringkas bertukar menjadi projek kejuruteraan yang besar.
Di Mana Ejen Sebenarnya Cemerlang
Saya tidak menentang ejen. Ejen berguna apabila:
- Tugasan berjalan untuk tempoh yang lama, seperti menyelidik pelbagai laman web.
- Pembuatan keputusan diperlukan berdasarkan logik tertentu.
- Campur tangan manusia adalah sebahagian daripada proses.
- Pelbagai alatan seperti Slack, GitHub, dan e-mel mesti bekerjasama.
Peraturan Saya
Pembangun sering terus melompat ke dalam rangka kerja yang kompleks. Sebelum anda berbuat demikian, tanya satu soalan: Bolehkah aliran kerja menyelesaikan ini?
Jika jawapannya ya, mulakan dari sana. Hanya tambah ejen apabila kerumitan memerlukannya.
Ikuti prinsip ini:
- Aliran kerja dahulu.
- Ejen kedua.
- Multi-ejen terakhir.
Kerumitan bukanlah inovasi. Kerumitan adalah kos. Pengguna tidak peduli berapa banyak ejen yang anda gunakan. Mereka peduli jika alatan itu berfungsi. Kesederhanaan adalah satu ciri (feature).
Sumber: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o