𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗣𝗮𝗻𝗱𝘂𝗮𝗻 𝗣𝗿𝗼𝗱𝘂𝗸𝘀𝗶 𝟮𝟬𝟮𝟲
RAG statik kini menjadi liabiliti bagi ejen AI.
Jika ejen anda hanya bergantung pada stor vektor, ia akan menghadapi Perangkap Pembekuan Pengetahuan (Knowledge Freeze Trap). Data anda ketinggalan 6 hingga 18 bulan daripada realiti. Ejen anda akan menjawab soalan dengan keyakinan tinggi menggunakan data lapuk.
Carian web Amazon Bedrock AgentCore mengubah perkara ini. Ia membolehkan ejen anda membuat pertanyaan pada data web secara langsung dan menerima petikan (snippets) yang berstruktur dan bersumberkan rujukan.
Berikut adalah cara menggunakannya untuk produksi:
Alatan yang Betul untuk Tugasan yang Betul
Jangan kelirukan Web Search dengan Browser Tool.
- Gunakan Web Search untuk fakta. Ia mengembalikan petikan. Ia pantas (380ms p50) dan murah.
- Gunakan Browser Tool untuk tindakan. Gunakannya untuk klik, mengisi borang, atau melayari laman web yang berat. Ia perlahan dan menggunakan 4x hingga 6x lebih banyak token.
Kelebihan Pelaksanaan
Kami menggunakan corak ini untuk pelanggan fintech. Kami melihat hasil berikut:
- Latensi menurun daripada 4.2s kepada 1.1s.
- Kami menjimatkan $340 sebulan dalam kos pengkomputeran pengindeksan semula (re-indexing).
Tip Persediaan
- Tetapkan kebenaran IAM anda. Anda memerlukan tindakan
agentcore:UseTool. Ketiadaan tindakan ini akan menyebabkan alatan gagal secara senyap. - Tetapkan versi anda (Pin your versions). Gunakan Boto3 1.34.0 atau versi lebih baharu untuk mengelakkan kegagalan senyap.
- Kawal kos anda. Tetapkan
max_resultskepada 3 dan bukannya 10. Ini mengurangkan volum token input sebanyak 65%. - Hadkan gelung (loops) anda. Jangan sambungkan lebih daripada 3 carian web berturut-turut untuk mengelakkan masa tamat (timeouts).
Strategi Hibrid
Seni bina terbaik bukanlah Web Search lawan RAG. Ia adalah kedua-duanya.
- Gunakan Web Search untuk data awam yang sensitif terhadap masa.
- Gunakan RAG untuk dokumen dalaman dan hak milik anda.
Penanda aras AWS menunjukkan pendekatan hibrid ini mengurangkan halusinasi sebanyak 40%.
Keselamatan dan Kepercayaan
Akses web membawa risiko seperti suntikan arahan (prompt injection). AgentCore membersihkan (sanitizes) hasil sebelum model melihatnya. Anda juga harus menggunakan Bedrock Guardrails pada output untuk perlindungan tambahan.
Peralihan sedang berlaku. Pada tahun 2026, carian web adalah lapisan grounding lalai. RAG adalah alatan khusus untuk data peribadi.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi