Por Dentro de um Agente de IA

Translated for your language. Ler o original.

AI-assisted draft.

GyaanSetu Editorialsemana passada2min de leitura

Por Dentro de um Agente de IA

Demos de agentes de IA parecem ótimas em vídeos. Elas frequentemente falham quando você faz perguntas reais.

O agente faz a coisa errada. Ele esquece decisões. Ele chama ferramentas que não existem. Ele entra em loops infinitos. Estas não são falhas do modelo. São falhas de fluxo de trabalho.

Um agente é um fluxo de trabalho de software. Um modelo de linguagem escolhe o próximo passo e chama ferramentas. A inteligência está na orquestração, não apenas no modelo.

Todo agente de produção depende de cinco pilares:

Planejamento: Pensar antes de agir.
Uso de Ferramentas: Interagir com o mundo.
Memória: Armazenar contexto e fatos.
Restrições: Definir limites e orçamentos.
Verificação: Provar que o trabalho está correto.

Estilos de Planejamento

Agentes ingênuos saltam direto para a ação. Isso leva a alucinações. Um bom agente planeja primeiro.

Plan-then-execute (Planejar e depois executar): O modelo escreve um plano completo. É fácil de auditar, mas difícil de adaptar se a realidade mudar.
ReAct (Reason + Act / Raciocinar + Agir): O modelo pensa, age e observa em um loop. É mais adaptável, mas custa mais em tokens e tempo.

Uso de Ferramentas

Sem ferramentas, um agente é apenas um chatbot. Uma ferramenta precisa de um nome, um esquema JSON e uma função.

Os modelos escolhem ferramentas com base em descrições. Se a sua descrição for vaga, o agente falhará. Trate as descrições como folhas de especificações. Defina para o que uma ferramenta serve e para o que ela não serve.

Sempre valide as chamadas de ferramentas. Se um modelo enviar argumentos incorretos, rejeite a chamada e envie o erro de volta para o modelo. Isso ajuda o agente a aprender durante o loop.

Memória

Memória não é apenas uma coisa.

Memória de Trabalho: A conversa atual e os resultados das ferramentas.
Scratchpad (Bloco de Notas): Um lugar para o agente escrever notas para si mesmo.
Memória de Longo Prazo: Armazenar fatos para sessões futuras.

Não dependa apenas de bancos de dados vetoriais. A memória baseada em arquivos usando arquivos markdown é frequentemente melhor. É fácil de auditar, editar e fazer grep.

Restrições e Segurança

Agentes de produção precisam de guardrails (proteções). Use estes quatro:

Listas de permissão de ferramentas (allowlists): Permita apenas ferramentas específicas e nomeadas.
Orçamentos de iteração: Limite o número de passos para evitar loops infinitos.
Orçamentos de tokens: Limite os custos estabelecendo um teto para o total de tokens.
Portões de aprovação (approval gates): Exija permissão humana para ações de alto risco, como enviar e-mails ou excluir dados.

Verificação

Nunca confie em um modelo quando ele diz que uma tarefa foi concluída. O modelo é confiante por padrão.

Use verificação real. Se um agente escreve código, execute os testes. Se ele gera JSON, verifique o esquema. Se ele realiza uma tarefa, execute uma consulta para confirmar a alteração.

Os melhores agentes usam verificação dentro do loop. Se um teste falhar, envie o erro de volta para o agente. Deixe-o tentar novamente.

Pare de perseguir prompts mais inteligentes. Comece a construir uma infraestrutura melhor.

Fonte: https://dev.to/nazar_boyko/inside-an-ai-agent-planning-tool-use-memory-constraints-and-verification-2fcc

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi

Por Dentro de um Agente de IA

Continuar lendo

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

O que aprendi ao rodar agentes de IA em produção

A Stack Exata que Uso para Construir Agentes de IA de Produção

A parte difícil dos agentes de IA não é agir, é planejar