Okno na budowanie ekspertyzy w dziedzinie AI się zamyka
Ludzie mówią o pokazach (demo) AI i systemach produkcyjnych tak, jakby były tym samym. Nie są.
Istnieje ogromna przepaść między efektownym demo a systemem, który działa w prawdziwym świecie.
Każdy nazywa wszystko agentem. Chatbot z pamięcią to agent. Skrypt z pętlą to agent. To błąd. Ten błąd prowadzi do złego inżynieringu.
W efekcie nadmiernie projektujesz proste zadania, a niedostatecznie projektujesz te trudne.
Oto prawdziwa definicja: Agent ma cel. Sam decyduje o kolejnym kroku. Radzi sobie z błędami. Wie, kiedy zadanie zostało zakończone. Wszystko inne to po prostu wywołanie funkcji.
Jak rozpoznać różnicę: • Jeśli człowiek musi prowadzić system na każdym kroku, jest to interfejs czatu. • Jeśli system potrafi podnieść się po nieudanym wywołaniu narzędzia, jest to agent. • Jeśli system dzieli cel na podzadania, jest to prawdziwy agent.
Skuteczne zespoły nie tylko gonią za nowymi modelami. Skupiają się na trzech rzeczach:
- Projektowanie narzędzi: Jak czysty jest interfejs?
- Obsługa błędów: Co się dzieje, gdy narzędzie nie zwraca niczego?
- Obserwowalność: Dlaczego agent podjął taką decyzję?
Framework, którego używasz, ma mniejsze znaczenie niż wzorce, których przestrzegasz. LangChain czy CrewAI to tylko narzędzia. Liczy się architektura.
Stosuj te wzorce:
- Planuj, a potem wykonuj: Użyj jednego kroku do planowania, a osobnego do działania.
- Oddziel pobieranie danych od rozumowania: Pobieranie danych i korzystanie z nich to różne zadania.
- Jawne przekazywanie zadań: Używaj ustrukturyzowanych logów, gdy jeden agent przekazuje pracę drugiemu.
RAG również powoduje problemy. Większość ludzi zawodzi przy chunkingu. Jeśli Twoje fragmenty (chunks) odcinają kontekst, model będzie halucynował. Musisz poprawić chunking i metadane, zanim zaczniesz obwiniać model.
Modele będą coraz lepsze. Tokeny będą tańsze. To jednak nie rozwiązuje wyzwania inżynieryjnego.
Prawdziwym wyzwaniem jest budowanie systemów, którym można ufać. Potrzebujesz nadzoru (governance) i niezawodnego korzystania z narzędzi.
Inżynierowie, którzy będą liczyć się za dwa lata, to nie prompt engineerowie. To projektanci systemów. Budują AI, które inni ludzie będą mogli utrzymywać.
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi
