Por que a maioria dos agentes de IA tem excesso de engenharia

Agentes de IA estão em toda parte. Você vê enxames de agentes, equipes autônomas e sistemas de autoaperfeiçoamento. Toda semana, um novo framework promete construir a próxima geração de IA.

Após estudar fluxos de trabalho de IA, cheguei a uma conclusão simples. A maioria dos agentes de IA tem excesso de engenharia.

Agentes não são inúteis. No entanto, muitos desenvolvedores resolvem problemas com agentes quando poderiam usar algo mais simples.

A Indústria Ama a Complexidade

Imagine que você queira construir um sistema para ler PDFs, extrair dados e responder perguntas. Muitos desenvolvedores criam uma arquitetura complexa com seis agentes, múltiplos prompts e gerenciamento de estado. Isso causa muitas dores de cabeça.

O mesmo problema muitas vezes pode ser resolvido com uma sequência simples:

  • PDF para Chunk
  • Chunk para Embed
  • Embed para Vector DB
  • LLM para Resposta

Às vezes, um fluxo de trabalho é suficiente. Você não precisa de um exército de agentes.

Fluxos de Trabalho Resolvem a Maioria dos Problemas

A maioria das aplicações de IA é determinística. Elas seguem uma sequência definida. Exemplos incluem:

  • Perguntas e respostas sobre documentos
  • Suporte ao cliente
  • Resumos de reuniões
  • Geração de blogs
  • Revisão de código

Estes são fluxos de trabalho, não sistemas autônomos. Fluxos de trabalho são mais fáceis de depurar, escalar, manter e explicar.

Agentes Introduzem Custos Ocultos

Cada novo agente adiciona problemas:

  • Custos de tokens mais altos devido a mais prompts
  • Mais latência devido a etapas extras
  • Mais chances de alucinações
  • Depuração mais difícil
  • Mais necessidades de infraestrutura

Uma aplicação simples se transforma em um projeto de engenharia massivo.

Onde os Agentes Realmente se Destacam

Eu não sou contra agentes. Agentes são úteis quando:

  • As tarefas rodam por muito tempo, como pesquisar em múltiplos sites.
  • A tomada de decisão é necessária com base em uma lógica específica.
  • A intervenção humana faz parte do processo.
  • Múltiplas ferramentas como Slack, GitHub e e-mail devem colaborar.

Minha Regra

Desenvolvedores costumam pular direto para frameworks complexos. Antes de fazer isso, faça uma pergunta: Um fluxo de trabalho pode resolver isso?

Se a resposta for sim, comece por aí. Só adicione agentes quando a complexidade exigir.

Siga este princípio:

  • Fluxo de trabalho primeiro.
  • Agente em segundo lugar.
  • Multi-agente por último.

Complexidade não é inovação. Complexidade é custo. Os usuários não se importam com quantos agentes você usa. Eles se importam se a ferramenta funciona. Simplicidade é uma funcionalidade.

Fonte: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o