Wnętrze agenta AI

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialw zeszłym tygodniu2min read

In this article

Wewnątrz agenta AI

Demo agentów AI wyglądają świetnie w filmach. Często zawodzą jednak, gdy zada się im prawdziwe pytania.

Agent robi coś niewłaściwego. Zapomina o podjętych decyzjach. Wywołuje narzędzia, które nie istnieją. Wpada w nieskończoną pętlę. To nie są błędy modelu. To błędy przepływu pracy (workflow).

Agent to programowy przepływ pracy (workflow). Model językowy wybiera kolejny krok i wywołuje narzędzia. Inteligencja tkwi w orkiestracji, a nie tylko w samym modelu.

Każdy agent produkcyjny opiera się na pięciu filarach:

Planowanie: Myślenie przed działaniem.
Używanie narzędzi: Interakcja ze światem.
Pamięć: Przechowywanie kontekstu i faktów.
Ograniczenia: Wyznaczanie granic i budżetów.
Weryfikacja: Potwierdzanie poprawności wykonanej pracy.

Style planowania

Naiwne agenty przechodzą od razu do działania. Prowadzi to do halucynacji. Dobry agent najpierw planuje.

Plan-then-execute: Model tworzy pełny plan. Jest on łatwy do audytu, ale trudny do dostosowania, jeśli rzeczywistość ulegnie zmianie.
ReAct (Reason + Act): Model myśli, działa i obserwuje w pętli. Jest bardziej adaptacyjny, ale kosztuje więcej tokenów i czasu.

Używanie narzędzi

Bez narzędzi agent jest tylko chatbotem. Narzędzie potrzebuje nazwy, schematu JSON i funkcji.

Modele wybierają narzędzia na podstawie opisów. Jeśli opis jest niejasny, agent zawiedzie. Traktuj opisy jak specyfikacje techniczne. Zdefiniuj, do czego narzędzie służy, a do czego nie.

Zawsze waliduj wywołania narzędzi. Jeśli model prześle błędne argumenty, odrzuć wywołanie i przekaż błąd z powrotem do modelu. Pomaga to agentowi uczyć się w trakcie trwania pętli.

Pamięć

Pamięć to nie tylko jedna rzecz.

Pamięć operacyjna (Working Memory): Bieżąca konwersacja i wyniki narzędzi.
Notatnik (Scratchpad): Miejsce, w którym agent może zapisywać notatki dla samego siebie.
Pamięć długotrwała: Przechowywanie faktów na potrzeby przyszłych sesji.

Nie polegaj wyłącznie na bazach wektorowych. Pamięć oparta na plikach (np. przy użyciu plików Markdown) jest często lepsza. Łatwo ją audytować, edytować i przeszukiwać za pomocą grep.

Ograniczenia i bezpieczeństwo

Agenci produkcyjni potrzebują barier ochronnych (guardrails). Skorzystaj z tych czterech:

Białe listy narzędzi: Pozwalaj tylko na konkretne, nazwane narzędzia.
Budżety iteracji: Ogranicz liczbę kroków, aby zapobiec nieskończonym pętlom.
Budżety tokenów: Ogranicz koszty poprzez ustalenie limitu całkowitej liczby tokenów.
Bramki zatwierdzania: Wymagaj zgody człowieka przy działaniach o wysokim ryzyku, takich jak wysyłanie e-maili czy usuwanie danych.

Weryfikacja

Nigdy nie ufaj modelowi, gdy twierdzi, że zadanie zostało wykonane. Modele są pewne siebie domyślnie.

Stosuj rzeczywistą weryfikację. Jeśli agent pisze kod, uruchom testy. Jeśli generuje JSON, sprawdź schemat. Jeśli wykonuje zadanie, uruchom zapytanie, aby potwierdzić zmianę.

Najlepsze agenty stosują weryfikację wewnątrz pętli. Jeśli test zakończy się niepowodzeniem, przekaż błąd z powrotem do agenta. Pozwól mu spróbować ponownie.

Przestań gonić za mądrzejszymi promptami. Zacznij budować lepszą infrastrukturę.

Source: https://dev.to/nazar_boyko/inside-an-ai-agent-planning-tool-use-memory-constraints-and-verification-2fcc

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

Wnętrze agenta AI

Wewnątrz agenta AI

Style planowania

Używanie narzędzi

Pamięć

Ograniczenia i bezpieczeństwo

Weryfikacja

Continue reading

Budowanie pętli agenta produkcyjnego

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

What I Learned Running AI Agents in Production

Dokładny stos technologiczny, którego używam do budowania produkcyjnych agentów AI

Najtrudniejszą częścią agentów AI nie jest działanie, lecz planowanie