Peluang untuk Membina Kepakaran AI Semakin Tertutup
Orang ramai bercakap tentang demo AI dan sistem pengeluaran seolah-olah kedua-duanya adalah sama. Hakikatnya tidak.
Terdapat jurang yang besar antara demo yang gah dengan sistem yang berfungsi dalam dunia nyata.
Semua orang memanggil segalanya sebagai ejen. Chatbot dengan memori adalah ejen. Skrip dengan gelung (loop) adalah ejen. Ini salah. Kesilapan ini membawa kepada kejuruteraan yang lemah.
Anda akhirnya melakukan kejuruteraan berlebihan (over-engineering) untuk tugas mudah dan kejuruteraan yang tidak mencukupi untuk tugas yang sukar.
Berikut adalah definisi sebenar: Seorang ejen mempunyai objektif. Ia menentukan langkah seterusnya. Ia mengendalikan kegagalan. Ia tahu bila sesuatu tugas telah selesai. Segalanya yang lain hanyalah panggilan fungsi (function call).
Cara untuk membezakannya: • Jika manusia perlu membimbing setiap langkah, ia adalah antara muka sembang (chat interface). • Jika sistem pulih daripada kegagalan panggilan alatan (tool call), ia adalah ejen. • Jika sistem memecahkan matlamat kepada subtugasan, ia adalah ejen sebenar.
Pasukan yang berjaya tidak hanya mengejar model baharu. Mereka fokus kepada tiga perkara:
- Reka bentuk alatan: Sejauh manakah kebersihan antara mukanya?
- Pengendalian kegagalan: Apa yang berlaku apabila alatan tidak mengembalikan apa-apa?
- Kebolehperhatian (Observability): Mengapa ejen tersebut membuat keputusan itu?
Rangka kerja (framework) yang anda gunakan kurang penting berbanding corak (patterns) yang anda ikuti. LangChain atau CrewAI hanyalah alatan. Seni bina (architecture) adalah perkara yang penting.
Gunakan corak ini:
- Rancang kemudian laksanakan: Gunakan satu langkah untuk merancang dan langkah berasingan untuk bertindak.
- Asingkan pencarian (retrieval) daripada penaakulan (reasoning): Mengambil data dan menggunakan data adalah tugas yang berbeza.
- Penyerahan eksplisit: Gunakan log berstruktur apabila satu ejen menyerahkan kerja kepada ejen yang lain.
RAG juga menimbulkan masalah. Kebanyakan orang gagal dalam proses chunking. Jika bahagian (chunks) anda memotong konteks, model akan berhalusinasi. Anda mesti membaiki chunking dan metadata anda sebelum menyalahkan model tersebut.
Model akan menjadi lebih baik. Token akan menjadi lebih murah. Ini tidak menyelesaikan cabaran kejuruteraan.
Cabaran sebenar adalah membina sistem yang boleh anda percayai. Anda memerlukan tadbir urus dan penggunaan alatan yang boleh dipercayai.
Jurutera yang akan menjadi penting dalam masa dua tahun lagi bukanlah jurutera prompt (prompt engineers). Mereka adalah pereka sistem. Mereka membina AI yang boleh diselenggara oleh orang lain.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
