Amazon Bedrock AgentCore Web Search: 7 błędów, które niszczą agentów produkcyjnych
Większość zespołów AI popełniła błąd w 2024 roku. Zbudowali potoki RAG, które opierają się na statycznych danych.
Statyczny potok RAG jest jak zdjęcie internetu. Staje się nieaktualny w momencie jego wykonania. AWS właśnie to zmienił, wprowadzając Web Search w Amazon Bedrock AgentCore.
Narzędzie to pozwala Twoim agentom korzystać z danych na żywo, bez konieczności budowania własnej infrastruktury wyszukiwania. Jednak wiele zespołów ponosi porażkę podczas wdrażania.
Oto 7 błędów, których musisz unikać:
Traktowanie Web Search jako zamiennika RAG. Wyszukiwanie w sieci służy do sprawdzania bieżących wydarzeń i cen. RAG służy do korzystania z wewnętrznych dokumentów firmy. Użyj routera, aby wybrać odpowiednią ścieżkę dla każdego zapytania.
Zakładanie, że Bedrock Guardrails obejmują Web Search. Nie obejmują. Web Search to oddzielna ścieżka. Musisz samodzielnie skonfigurować kontrole polityki AgentCore, takie jak listy dozwolonych domen (allowlists) i usuwanie danych PII (PII scrubbing).
Przeprowadzanie redundantnych wyszukiwań w systemach wieloagentowych. W frameworkach takich jak AutoGen każdy podagent może wywoływać wyszukiwarkę oddzielnie. Powoduje to wzrost kosztów od 4 do 8 razy. Zamiast tego użyj współdzielonej pamięci wyszukiwania (shared search memory).
Ignorowanie pułapki zamrożonej wiedzy (Frozen Knowledge Trap). Nie obwiniaj swojego modelu, gdy podaje nieaktualne odpowiedzi. Problem prawdopodobnie leży w architekturze danych. Jeśli odpowiedź zmienia się co tydzień, potrzebujesz wyszukiwania na żywo.
Pomijanie obserwowalności (observability). Jeśli Twój agent halucynuje, musisz wiedzieć dlaczego. Czy był to zły wynik wyszukiwania, czy błąd modelu? Użyj Langfuse, aby śledzić każdy krok.
Sztywne kodowanie (hardcoding) konkretnych punktów końcowych (endpoints). AWS będzie aktualizować te narzędzia. Używaj deskryptorów narzędzi zgodnych z MCP, aby móc łatwo wymieniać dostawców.
Brak testów pod kątem prompt injection. Zatruta strona internetowa może przejąć kontrolę nad Twoim agentem. Przed wdrożeniem przetestuj agenta za pomocą znanych ładunków (payloads) typu injection.
Jak zbudować agenta gotowego do produkcji:
- Sklasyfikuj intencję zapytania.
- Skieruj do RAG, Web Search lub Memory.
- Przepuść wyniki wyszukiwania przez filtr polityki.
- Złóż kontekst i wywołaj model.
Przestań budować statyczne systemy. Przejdź na agentów działających na żywo i osadzonych w faktach (grounded agents).
Optional learning community: https://t.me/GyaanSetuAi