𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗞𝗶𝗹𝗹 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁𝘀
Kebanyakan pasukan AI melakukan kesilapan pada tahun 2024. Mereka membina saluran paip (pipeline) RAG yang bergantung pada data statik.
Saluran paip RAG yang statik adalah seperti sekeping foto internet. Ia menjadi lapuk sebaik sahaja anda mengambilnya. AWS baru sahaja mengubah perkara ini dengan Web Search pada Amazon Bedrock AgentCore.
Alat ini membolehkan ejen anda menggunakan data langsung tanpa anda perlu membina infrastruktur carian. Walau bagaimanapun, banyak pasukan gagal semasa deployment.
Berikut adalah 7 kesilapan yang mesti anda elakkan:
Menggunakan carian web sebagai pengganti RAG. Carian web adalah untuk peristiwa semasa dan harga. RAG adalah untuk dokumen dalaman syarikat anda. Gunakan penghala (router) untuk memilih laluan yang betul bagi setiap pertanyaan.
Menganggap Bedrock Guardrails merangkumi carian web. Ia tidak merangkuminya. Carian web adalah laluan yang berasingan. Anda mesti menetapkan kawalan polisi AgentCore sendiri seperti senarai putih domain (domain allowlists) dan pembersihan PII (PII scrubbing).
Menjalankan carian berulang dalam sistem pelbagai ejen (multi-agent systems). Dalam rangka kerja (frameworks) seperti AutoGen, setiap sub-ejen mungkin memanggil carian secara berasingan. Ini meningkatkan kos anda sebanyak 4x hingga 8x ganda. Gunakan memori carian kongsi sebagai ganti.
Mengabaikan Perangkap Pengetahuan Beku (Frozen Knowledge Trap). Jangan salahkan model anda apabila ia memberikan jawapan lama. Masalahnya berkemungkinan besar adalah seni bina data anda. Jika jawapan berubah setiap minggu, anda memerlukan carian langsung.
Mengabaikan kebolehperhatian (observability). Jika ejen anda mengalami halusinasi, anda perlu tahu mengapa. Adakah ia disebabkan hasil carian yang buruk atau ralat model? Gunakan Langfuse untuk menjejaki setiap langkah.
Melakukan pengekodan keras (hardcoding) terhadap titik akhir (endpoints) tertentu. AWS akan mengemas kini alatan ini. Gunakan deskriptor alatan yang serasi dengan MCP supaya anda boleh menukar pembekal dengan mudah.
Gagal menguji suntikan arahan (prompt injection). Laman web yang telah dicemari boleh merampas ejen anda. Uji ejen anda dengan muatan suntikan (injection payloads) yang diketahui sebelum anda melancarkannya.
Cara membina ejen yang sedia untuk produksi:
- Klasifikasikan niat pertanyaan.
- Hala ke RAG, Carian Web, atau Memori.
- Salurkan hasil web melalui penapis polisi.
- Cantumkan konteks dan panggil model.
Berhenti membina sistem statik. Beralihlah kepada ejen yang langsung dan berasaskan fakta (grounded).
Optional learning community: https://t.me/GyaanSetuAi