Amazon Bedrock AgentCore Web Search: Üretim Ortamı Ajanlarını Öldüren 7 Hata
Çoğu yapay zeka ekibi 2024 yılında bir hata yaptı. Statik verilere dayanan RAG boru hatları (pipelines) inşa ettiler.
Statik bir RAG boru hattı, internetin bir fotoğrafı gibidir. Çekildiği anda güncelliğini yitirir. AWS, Amazon Bedrock AgentCore üzerindeki Web Search ile bunu az önce değiştirdi.
Bu araç, arama altyapısı kurmanıza gerek kalmadan ajanlarınızın canlı verileri kullanmasına olanak tanır. Ancak birçok ekip, yayına alma (deployment) aşamasında başarısız oluyor.
İşte kaçınmanız gereken 7 hata:
Web aramayı RAG yerine kullanmak. Web araması güncel olaylar ve fiyatlandırma içindir. RAG ise şirket içi belgeleriniz içindir. Her sorgu için doğru yolu seçmek üzere bir yönlendirici (router) kullanın.
Bedrock Guardrails'ın web aramayı kapsadığını varsaymak. Kapsamaz. Web araması ayrı bir yoldur. Alan adı izin listeleri (allowlists) ve PII temizleme (scrubbing) gibi AgentCore politika kontrollerini kendiniz ayarlamalısınız.
Çoklu ajan sistemlerinde gereksiz aramalar çalıştırmak. AutoGen gibi çerçevelerde (frameworks), her alt ajan aramayı ayrı ayrı çağırabilir. Bu, maliyetlerinizi 4 ila 8 kat artırır. Bunun yerine paylaşılan bir arama belleği (search memory) kullanın.
Donmuş Bilgi Tuzağını (Frozen Knowledge Trap) göz ardı etmek. Modeliniz eski cevaplar verdiğinde ona suç atmayın. Sorun muhtemelen veri mimarinizdir. Eğer cevap haftalık olarak değişiyorsa, canlı aramaya ihtiyacınız var demektir.
Gözlemlenebilirliği (observability) atlamak. Eğer ajanınız halüsinasyon görüyorsa, nedenini bilmeniz gerekir. Kötü bir arama sonucu mu yoksa bir model hatası mıydı? Her adımı izlemek (trace) için Langfuse kullanın.
Belirli uç noktalara (endpoints) karşı sabit kodlama (hardcoding) yapmak. AWS bu araçları güncelleyecektir. Sağlayıcıları kolayca değiştirebilmek için MCP uyumlu araç tanımlayıcıları (tool descriptors) kullanın.
Prompt injection testlerini yapmamak. Zehirlenmiş bir web sayfası ajanınızın kontrolünü ele geçirebilir. Canlıya geçmeden önce ajanınızı bilinen injection payload'ları ile test edin.
Üretim ortamına hazır bir ajan nasıl inşa edilir:
- Sorgu niyetini sınıflandırın.
- RAG, Web Search veya Belleğe (Memory) yönlendirin.
- Web sonuçlarını bir politika filtresinden geçirin.
- Bağlamı (context) bir araya getirin ve modeli çağırın.
Statik sistemler kurmayı bırakın. Canlı ve temellendirilmiş (grounded) ajanlara yönelin.
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi