Por que a maioria dos agentes de IA tem excesso de engenharia
Agentes de IA estão em toda parte. Você vê enxames de agentes, equipes autônomas e sistemas de autoaperfeiçoamento. Toda semana, um novo framework promete construir a próxima geração de IA.
Após estudar fluxos de trabalho de IA, cheguei a uma conclusão simples. A maioria dos agentes de IA tem excesso de engenharia.
Agentes não são inúteis. No entanto, muitos desenvolvedores resolvem problemas com agentes quando poderiam usar algo mais simples.
A Indústria Ama a Complexidade
Imagine que você queira construir um sistema para ler PDFs, extrair dados e responder perguntas. Muitos desenvolvedores criam uma arquitetura complexa com seis agentes, múltiplos prompts e gerenciamento de estado. Isso causa muitas dores de cabeça.
O mesmo problema muitas vezes pode ser resolvido com uma sequência simples:
- PDF para Chunk
- Chunk para Embed
- Embed para Vector DB
- LLM para Resposta
Às vezes, um fluxo de trabalho é suficiente. Você não precisa de um exército de agentes.
Fluxos de Trabalho Resolvem a Maioria dos Problemas
A maioria das aplicações de IA é determinística. Elas seguem uma sequência definida. Exemplos incluem:
- Perguntas e respostas sobre documentos
- Suporte ao cliente
- Resumos de reuniões
- Geração de blogs
- Revisão de código
Estes são fluxos de trabalho, não sistemas autônomos. Fluxos de trabalho são mais fáceis de depurar, escalar, manter e explicar.
Agentes Introduzem Custos Ocultos
Cada novo agente adiciona problemas:
- Custos de tokens mais altos devido a mais prompts
- Mais latência devido a etapas extras
- Mais chances de alucinações
- Depuração mais difícil
- Mais necessidades de infraestrutura
Uma aplicação simples se transforma em um projeto de engenharia massivo.
Onde os Agentes Realmente se Destacam
Eu não sou contra agentes. Agentes são úteis quando:
- As tarefas rodam por muito tempo, como pesquisar em múltiplos sites.
- A tomada de decisão é necessária com base em uma lógica específica.
- A intervenção humana faz parte do processo.
- Múltiplas ferramentas como Slack, GitHub e e-mail devem colaborar.
Minha Regra
Desenvolvedores costumam pular direto para frameworks complexos. Antes de fazer isso, faça uma pergunta: Um fluxo de trabalho pode resolver isso?
Se a resposta for sim, comece por aí. Só adicione agentes quando a complexidade exigir.
Siga este princípio:
- Fluxo de trabalho primeiro.
- Agente em segundo lugar.
- Multi-agente por último.
Complexidade não é inovação. Complexidade é custo. Os usuários não se importam com quantos agentes você usa. Eles se importam se a ferramenta funciona. Simplicidade é uma funcionalidade.
Fonte: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o