Mengapa Kebanyakan Ejen AI Terlalu Kompleks (Overengineered)

Ejen AI ada di mana-mana.

Anda melihat kumpulan ejen (agent swarms), pasukan autonomi, dan ejen perancangan. Rangka kerja (framework) baharu muncul setiap minggu. Selepas mengkaji aliran kerja (workflow) AI, saya sampai kepada satu kesimpulan.

Kebanyakan ejen AI terlalu kompleks (overengineered).

Ejen tidaklah tidak berguna. Pembina sering menyelesaikan masalah dengan ejen yang sebenarnya boleh diselesaikan dengan aliran kerja yang ringkas.

Industri Menyukai Kerumitan

Bayangkan anda ingin membina sistem untuk membaca PDF dan menjawab soalan.

Sesetengah pembina mencipta seni bina yang besar. Mereka menggunakan enam ejen, pengurusan keadaan (state management) yang kompleks, dan penyinkronan memori. Ini menyebabkan banyak masalah.

Anda sering kali boleh menyelesaikan masalah yang sama dengan urutan yang ringkas: • PDF • Chunk • Embed • Vector DB • LLM • Respons

Aliran kerja sudah mencukupi. Anda tidak memerlukan tentera ejen.

Aliran Kerja Menyelesaikan Kebanyakan Masalah

Kebanyakan aplikasi AI adalah deterministik. Ia mengikut urutan yang ditetapkan.

Contohnya termasuk: • Soal Jawab Dokumen • Sokongan pelanggan • Ringkasan mesyuarat • Penjanaan blog • Semakan kod

Ini adalah aliran kerja, bukan sistem autonomi. Aliran kerja lebih mudah untuk dinyahpepijat (debug), diskalakan, dan diselenggara. Kerumitan haruslah berasas.

Ejen Membawa Kos Tersembunyi

Setiap ejen tambahan menambah: • Kos token yang lebih tinggi • Latensi yang lebih tinggi • Lebih banyak peluang untuk halusinasi • Nyahpepijat (debugging) yang lebih sukar • Infrastruktur yang kompleks

Aplikasi yang ringkas dengan cepat menjadi projek kejuruteraan yang besar.

Di Mana Ejen Sebenarnya Cemerlang

Saya bukan anti-ejen. Ejen berfungsi dengan baik apabila: • Tugasan mengambil masa yang lama, seperti menyelidik pelbagai laman web. • Keputusan diperlukan berdasarkan logik. • Pelbagai alatan mesti bekerjasama, seperti Email, GitHub, dan Slack. • Campur tangan manusia adalah sebahagian daripada kitaran (loop).

Peraturan Saya

Pembina sering terus terjun ke dalam rangka kerja seperti CrewAI atau LangGraph dengan segera. Sebelum anda berbuat demikian, tanya satu soalan: Bolehkah aliran kerja menyelesaikan ini?

Jika jawapannya ya, mulakan dari sana. Gunakan ejen hanya apabila kerumitan memerlukannya. Jangan gunakannya hanya kerana hype.

Saya mengikut prinsip ini:

  1. Aliran kerja dahulu.
  2. Ejen kedua.
  3. Multi-agent terakhir.

Kerumitan bukanlah inovasi. Kerumitan adalah kos. Pengguna tidak peduli berapa banyak ejen yang anda gunakan. Mereka peduli jika alatan anda berfungsi.

Kesederhanaan adalah ciri yang terbaik.

Sumber: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi