Najgorętszy framework AI ma śmiertelną wadę

Ludzie nazywają agentem wszystko.

Skrypt z pętlą to agent. Chatbot z pamięcią to agent. Ten błąd prowadzi do złego inżynieringu.

Zespoły marnują tygodnie na budowanie złożonej orkiestracji dla prostych zadań. Nie potrzebujesz agenta do pojedynczego promptu.

Agent musi mieć cel. Musi sam decydować o swoich kolejnych krokach. Musi radzić sobie z błędami i wiedzieć, kiedy zadanie zostało zakończone.

Użyj tych zasad, aby sprawdzić swój system:

  • Jeśli człowiek musi prowadzić go na każdym kroku, jest to interfejs czatu.
  • Jeśli Twój system potrafi podnieść się po nieudanym wywołaniu narzędzia, masz agenta.
  • Jeśli Twój system dzieli cel na podzadania, masz prawdziwego agenta.

Większość skutecznych agentów jest wyspecjalizowana. Wykonują jedno zadanie, takie jak ekstrakcja dokumentów czy przegląd kodu. Nie są to ogólne silniki rozumowania.

Najlepsze zespoły skupiają się na trzech rzeczach:

  • Projektowanie narzędzi: tworzenie czystych interfejsów dla agenta.
  • Obsługa błędów: decydowanie o tym, co się dzieje, gdy narzędzie zawiedzie.
  • Obserwowalność (observability): śledzenie, dlaczego agent podjął daną decyzję.

Frameworki takie jak LangChain czy CrewAI są mniej istotne niż wzorce. Przebudowałem tę samą architekturę w trzech różnych frameworkach. Wyniki były takie same.

Trzymaj się tych wzorców:

  • Planuj, a potem wykonuj: użyj jednego kroku do planowania i osobnego kroku do pracy.
  • Oddziel pobieranie od rozumowania: pobieranie danych to nie to samo, co ich wykorzystywanie.
  • Jawne przekazywanie zadań: używaj ustrukturyzowanych logów, gdy jeden agent przekazuje pracę drugiemu.

Systemy RAG często zawodzą z powodu złego dzielenia tekstu na fragmenty (chunking). Jeśli Twój model poprawnie podaje fakty techniczne, ale gubi kontekst, problemem są Twoje fragmenty (chunks). Wypróbuj semantyczne dzielenie (semantic chunking) lub parent-document retrieval.

Przestań gonić za benchmarkami. Prawdziwym wyzwaniem jest budowanie systemów, którym możesz zaufać, gdy nie patrzysz.

Skup się na zarządzaniu (governance), obserwowalności i niezawodnym korzystaniu z narzędzi. Najlepsi inżynierowie skupią się na projektowaniu systemów, a nie tylko na prompt engineeringu.

Źródło: https://dev.to/aibughunter/the-hottest-ai-framework-right-now-has-a-fatal-flaw-nobody-mentions-2ing

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi