Amazon Bedrock AgentCore Web Search: Przewodnik produkcyjny
Twój agent AI nie halucynuje dlatego, że Twój model jest słaby. Halucynuje, ponieważ Twoja architektura utknęła w przeszłości.
Większość potoków (pipelines) RAG to kosztowne rozwiązania doraźne dla nieaktualnych danych. AWS oferuje teraz rozwiązanie: Web Search w Amazon Bedrock AgentCore. Jest to zarządzane narzędzie, które zapewnia Twoim agentom dostęp do sieci na żywo.
Dlaczego to ma znaczenie:
Luka między tym, co wie LLM, a tym, o co pytają użytkownicy, powiększa się każdego dnia. Ta luka zmienia agentów w maszyny generujące ryzyko.
Co zyskujesz dzięki AgentCore Web Search:
- Strukturalny dostęp do wyników z sieci na żywo.
- Brak potrzeby tworzenia własnych crawlerów.
- Brak konieczności zawierania umów z zewnętrznymi dostawcami API wyszukiwarek.
- Brak oddzielnego rozliczania.
- Pojedyncze wywołanie SDK obsługujące crawling, ranking i rozliczenia.
Przestań płacić „podatek od zamrożenia wiedzy” (Knowledge Freeze Tax). Jest to koszt korzystania z nieaktualnych danych. Objawia się on błędnymi odpowiedziami, zmarnowanymi godzinami pracy inżynierów i wysokimi opóźnieniami.
Jak zbudować potok klasy produkcyjnej:
Klasyfikacja intencji: Użyj routera, aby zdecydować, czy zapytanie wymaga dostępu do sieci na żywo, wewnętrznego RAG, czy danych ustrukturyzowanych. Nie uruchamiaj wyszukiwania w sieci przy każdym zapytaniu, bo szybko wyczerpiesz budżet.
Wywołanie Web Search: Narzędzie zwraca tytuły, adresy URL, fragmenty (snippets) i znaczniki czasu.
Synteza wyników: Wstrzyknij fragmenty i znaczniki czasu do modelu. Musisz dołączyć znaczniki czasu, aby model wiedział, czy źródło jest nieaktualne.
Obserwowalność (Observability): Użyj Langfuse, aby śledzić, które wyniki z sieci wpłynęły na Twoje odpowiedzi. Jest to kluczowe dla zachowania zgodności (compliance) w przedsiębiorstwach.
Kluczowe wskazówki techniczne:
- Używaj Web Search do szybkich faktów.
- Używaj Browser Tool tylko do złożonych stron JavaScript lub stron wymagających logowania. Używanie Browser Tool do prostych wyszukiwań dodaje od 3 do 8 sekund opóźnienia.
- Sprawdź uprawnienia IAM. Upewnij się, że posiadasz uprawnienie
bedrock-agentcore:InvokeWebSearch. - Zastosuj podejście hybrydowe. Używaj Web Search do danych zewnętrznych, a RAG do wewnętrznych, prywatnych dokumentów.
Celem nie jest jak najczęstsze korzystanie z wyszukiwania w sieci. Celem jest zbudowanie wystarczająco inteligentnego routera, który będzie go używał tylko wtedy, gdy jest to konieczne.
Optional learning community: https://t.me/GyaanSetuAi