Por Dentro de um Agente de IA

Demos de agentes de IA parecem ótimas em vídeos. Elas frequentemente falham quando você faz perguntas reais.

O agente faz a coisa errada. Ele esquece decisões. Ele chama ferramentas que não existem. Ele entra em loops infinitos. Estas não são falhas do modelo. São falhas de fluxo de trabalho.

Um agente é um fluxo de trabalho de software. Um modelo de linguagem escolhe o próximo passo e chama ferramentas. A inteligência está na orquestração, não apenas no modelo.

Todo agente de produção depende de cinco pilares:

  • Planejamento: Pensar antes de agir.
  • Uso de Ferramentas: Interagir com o mundo.
  • Memória: Armazenar contexto e fatos.
  • Restrições: Definir limites e orçamentos.
  • Verificação: Provar que o trabalho está correto.

Estilos de Planejamento

Agentes ingênuos saltam direto para a ação. Isso leva a alucinações. Um bom agente planeja primeiro.

  1. Plan-then-execute (Planejar e depois executar): O modelo escreve um plano completo. É fácil de auditar, mas difícil de adaptar se a realidade mudar.
  2. ReAct (Reason + Act / Raciocinar + Agir): O modelo pensa, age e observa em um loop. É mais adaptável, mas custa mais em tokens e tempo.

Uso de Ferramentas

Sem ferramentas, um agente é apenas um chatbot. Uma ferramenta precisa de um nome, um esquema JSON e uma função.

Os modelos escolhem ferramentas com base em descrições. Se a sua descrição for vaga, o agente falhará. Trate as descrições como folhas de especificações. Defina para o que uma ferramenta serve e para o que ela não serve.

Sempre valide as chamadas de ferramentas. Se um modelo enviar argumentos incorretos, rejeite a chamada e envie o erro de volta para o modelo. Isso ajuda o agente a aprender durante o loop.

Memória

Memória não é apenas uma coisa.

  • Memória de Trabalho: A conversa atual e os resultados das ferramentas.
  • Scratchpad (Bloco de Notas): Um lugar para o agente escrever notas para si mesmo.
  • Memória de Longo Prazo: Armazenar fatos para sessões futuras.

Não dependa apenas de bancos de dados vetoriais. A memória baseada em arquivos usando arquivos markdown é frequentemente melhor. É fácil de auditar, editar e fazer grep.

Restrições e Segurança

Agentes de produção precisam de guardrails (proteções). Use estes quatro:

  • Listas de permissão de ferramentas (allowlists): Permita apenas ferramentas específicas e nomeadas.
  • Orçamentos de iteração: Limite o número de passos para evitar loops infinitos.
  • Orçamentos de tokens: Limite os custos estabelecendo um teto para o total de tokens.
  • Portões de aprovação (approval gates): Exija permissão humana para ações de alto risco, como enviar e-mails ou excluir dados.

Verificação

Nunca confie em um modelo quando ele diz que uma tarefa foi concluída. O modelo é confiante por padrão.

Use verificação real. Se um agente escreve código, execute os testes. Se ele gera JSON, verifique o esquema. Se ele realiza uma tarefa, execute uma consulta para confirmar a alteração.

Os melhores agentes usam verificação dentro do loop. Se um teste falhar, envie o erro de volta para o agente. Deixe-o tentar novamente.

Pare de perseguir prompts mais inteligentes. Comece a construir uma infraestrutura melhor.

Fonte: https://dev.to/nazar_boyko/inside-an-ai-agent-planning-tool-use-memory-constraints-and-verification-2fcc

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi