Wąskim gardłem mojego agenta AI nie był model, lecz architektura.

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial23 godziny temu2min read

Wąskim gardłem mojego agenta AI nie był model, lecz architektura.

Wąskim gardłem mojego agenta AI nie był model. Była nim architektura.

Trzy miesiące temu proces u jednego z klientów uległ awarii.

Używałem jednego agenta do klasyfikacji, tagowania i podsumowywania dokumentów. Przy 50 dokumentach dziennie działało to dobrze. Potem liczba dokumentów wzrosła do 500.

Agent potrzebował 40 minut na każdą partię. Nie skalował się. Padł.

Nie przeszedłem na większy model. Zamiast tego podzieliłem agenta na trzy wyspecjalizowane role. Role te działały równolegle.

Przepustowość wzrosła z 40 minut do 4 minut. Model pozostał ten sam. Zmieniła się architektura.

Większość programistów popełnia błąd, budując agentów sekwencyjnych. Jeden agent wykonuje wszystko po kolei.

Jeśli masz 500 dokumentów i trzy zadania na dokument, wykonujesz 1500 wywołań LLM jedno po drugim. Nawet przy 2 sekundach na wywołanie, czekasz 50 minut. Twój model spędza większość czasu na czekaniu.

Rozwiązaniem jest użycie wyspecjalizowanych agentów działających równolegle.

Używaj mniejszych, skoncentrowanych promptów systemowych.
U

Wąskim gardłem mojego agenta AI nie był model, lecz architektura.

Continue reading

𝗠𝘂𝗹𝘁𝗶 𝗔𝗴𝗲𝗻𝘁 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀: 𝗔 𝗚𝘂𝗶𝗱𝗲 𝘁𝗼 𝗪𝗼𝗿𝗸𝗳𝗹𝗼𝘄𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗳𝗲𝗲𝗹𝘀 𝘀𝗹𝗼𝘄? 𝗠𝗮𝘆𝗯𝗲 𝗶𝘁'𝘀 𝗻𝗼𝘁 𝗱𝘂𝗺𝗯.

Wąskim gardłem Twojego agenta AI nie są parametry – to nieuporządkowany dom

Agenci AI zawodzą przez nieuporządkowaną architekturę