Por Dentro de um Agente de IA
Demos de agentes de IA parecem ótimas em vídeos. Elas frequentemente falham quando você faz perguntas reais.
O agente faz a coisa errada. Ele esquece decisões. Ele chama ferramentas que não existem. Ele entra em loops infinitos. Estas não são falhas do modelo. São falhas de fluxo de trabalho.
Um agente é um fluxo de trabalho de software. Um modelo de linguagem escolhe o próximo passo e chama ferramentas. A inteligência está na orquestração, não apenas no modelo.
Todo agente de produção depende de cinco pilares:
- Planejamento: Pensar antes de agir.
- Uso de Ferramentas: Interagir com o mundo.
- Memória: Armazenar contexto e fatos.
- Restrições: Definir limites e orçamentos.
- Verificação: Provar que o trabalho está correto.
Estilos de Planejamento
Agentes ingênuos saltam direto para a ação. Isso leva a alucinações. Um bom agente planeja primeiro.
- Plan-then-execute (Planejar e depois executar): O modelo escreve um plano completo. É fácil de auditar, mas difícil de adaptar se a realidade mudar.
- ReAct (Reason + Act / Raciocinar + Agir): O modelo pensa, age e observa em um loop. É mais adaptável, mas custa mais em tokens e tempo.
Uso de Ferramentas
Sem ferramentas, um agente é apenas um chatbot. Uma ferramenta precisa de um nome, um esquema JSON e uma função.
Os modelos escolhem ferramentas com base em descrições. Se a sua descrição for vaga, o agente falhará. Trate as descrições como folhas de especificações. Defina para o que uma ferramenta serve e para o que ela não serve.
Sempre valide as chamadas de ferramentas. Se um modelo enviar argumentos incorretos, rejeite a chamada e envie o erro de volta para o modelo. Isso ajuda o agente a aprender durante o loop.
Memória
Memória não é apenas uma coisa.
- Memória de Trabalho: A conversa atual e os resultados das ferramentas.
- Scratchpad (Bloco de Notas): Um lugar para o agente escrever notas para si mesmo.
- Memória de Longo Prazo: Armazenar fatos para sessões futuras.
Não dependa apenas de bancos de dados vetoriais. A memória baseada em arquivos usando arquivos markdown é frequentemente melhor. É fácil de auditar, editar e fazer grep.
Restrições e Segurança
Agentes de produção precisam de guardrails (proteções). Use estes quatro:
- Listas de permissão de ferramentas (allowlists): Permita apenas ferramentas específicas e nomeadas.
- Orçamentos de iteração: Limite o número de passos para evitar loops infinitos.
- Orçamentos de tokens: Limite os custos estabelecendo um teto para o total de tokens.
- Portões de aprovação (approval gates): Exija permissão humana para ações de alto risco, como enviar e-mails ou excluir dados.
Verificação
Nunca confie em um modelo quando ele diz que uma tarefa foi concluída. O modelo é confiante por padrão.
Use verificação real. Se um agente escreve código, execute os testes. Se ele gera JSON, verifique o esquema. Se ele realiza uma tarefa, execute uma consulta para confirmar a alteração.
Os melhores agentes usam verificação dentro do loop. Se um teste falhar, envie o erro de volta para o agente. Deixe-o tentar novamente.
Pare de perseguir prompts mais inteligentes. Comece a construir uma infraestrutura melhor.
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
