A parte difícil dos Agentes de IA não é fazer, é planejar

Construir um agente de IA que executa tarefas é fácil. Construir um que as planeje corretamente é difícil.

Eu construí uma CLI onde você digita uma frase e um LLM executa ações em suas contas reais. Eu utilizo dois modos: modo Direto e modo de Planejamento.

O modo Direto é para velocidade. O modo de Planejamento é para segurança. No modo de Planejamento, o agente mostra cada etapa antes de tocar nos seus dados.

Aqui está como eu construí um planejador confiável:

• Divida o cérebro Um único agente não consegue fazer tanto o planejamento quanto a execução. Um agente de planejamento quer pensar. Um agente de execução quer agir. Eu os separei em dois agentes diferentes com dois prompts de sistema diferentes. Isso evita que eles entrem em conflito.

• Dê olhos ao agente Um planejador que apenas adivinha é perigoso. Minha primeira versão criava planos baseados em suposições. Agora, o planejador usa ferramentas de apenas leitura para pesquisar seus dados primeiro. Ele analisa seus campos reais do Salesforce antes de escrever uma única etapa.

• Pré-preencha as respostas Agentes costumam fazer perguntas ruins. Se eles fizerem perguntas demais, você acaba fazendo o trabalho por eles. Eu mudei isso. O planejador ainda faz perguntas, mas fornece uma resposta recomendada. Você apenas confirma ou faz um ajuste. Isso mantém o plano preciso sem a necessidade de entrada manual de dados.

• Passe o contexto, não apenas a lista Se você der ao executor apenas uma lista de etapas, ele perde o raciocínio. Eu fiz com que o planejador passasse as suposições e os riscos junto com as etapas. O executor agora sabe o "porquê" por trás de cada ação.

• Sinalize o perigo Um plano só é seguro se você conseguir ver os riscos. Meu sistema marca ações destrutivas, como excluir ou renomear. Quando o agente chega a uma etapa destrutiva, ele para e pergunta a você.

• Use os dados como critério de desempate Se um agente pensa que uma etapa falhou e você diz para ele tentar novamente, ele não obedece cegamente. Ele verifica os dados reais da plataforma. Se os dados mostrarem que a tarefa já foi concluída, o agente confia nos dados em vez da sua afirmação.

A verdade sobre a segurança: O modo de Planejamento não impede injeção de prompt ou um usuário que clica em "aprovar" sem olhar. Ele transfere a responsabilidade de "confiar no modelo" para "confiar que o humano fará a revisão".

A estrutura fornece as proteções, mas sua revisão fornece a segurança final.

Fonte: https://dev.to/abdullahsaad5/the-hard-part-of-my-ai-agent-wasnt-doing-the-work-it-was-planning-it-n0k

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi