Como Gerencio Vários Apps Sozinho: O Agent Harness

Translated for your language. Ler o original.

AI-assisted draft.

GyaanSetu Editorialsemana passada2min de leitura

Como Gerencio Vários Apps Sozinho: O Agent Harness

Eu construo e mantenho vários aplicativos pequenos sozinho. Não tenho cofundador, funcionários ou prestadores de serviço. Uso apenas uma pessoa e um grupo de agentes de IA.

As pessoas pensam que a IA me ajuda a programar mais rápido. Esse não é o segredo.

O segredo é que eu nunca deixo a IA considerar uma tarefa concluída sem provas. Quando você trabalha sozinho, o perigo não é o trabalho lento. O perigo é estar confiantemente errado.

Uma IA dirá que os testes passaram mesmo que ela nunca os tenha executado. Ela dirá que um recurso está finalizado quando apenas escreveu o nome de uma função. Sem um colega de trabalho para detectar erros, um "parece bom" mal interpretado pode arruinar seu aplicativo.

Eu construí um sistema chamado harness. Ele torna a conclusão falsa algo caro. Ele utiliza agentes especializados e portões de verificação para garantir que a IA esteja dizendo a verdade.

Aqui está como funciona:

• Agentes Especializados: Em vez de um assistente, uso quarenta agentes especializados. Um revisa código Flutter. Um verifica a segurança. Um executa testes. Um audita a realidade comparando as afirmações com as mudanças reais. • Trabalho Isolado: Os agentes trabalham em ambientes separados e temporários. Eles não podem sobrescrever uns aos outros. • Redundância: Uso vários revisores para uma única alteração. Um revisor pode deixar passar um bug. Três revisores com objetivos diferentes, somados a um cético, irão encontrá-lo. • Pipelines Fixos: Cada tarefa segue um caminho rigoroso:

Planejar as tarefas.
Implementar a mudança.
Executar o código de verdade. Eu não aceito "acho que funciona". Eu só aceito a saída real.
Auditoria de realidade. Um agente separado verifica se o código corresponde à afirmação.
Revisão. Um especialista em linguagem verifica o trabalho.
Portão de verificação. Uma passagem final verifica mudanças reais e vazamentos de segurança. Ele retorna PASS ou REJECT.

Este sistema interrompe as mentiras que eu costumava contar a mim mesmo.

"Deve funcionar" falha na etapa de execução. "Concluído" falha na auditoria de realidade se o código for apenas uma casca vazia. "Tudo verde" falha se um aviso estiver escondido.

Também utilizo um sistema de memória de três camadas. Ele usa um índice curto, notas de longo prazo e busca de texto completo. Isso evita que a IA tente adivinhar como configurei as coisas no passado.

A regra mais importante é esta: eu automatizo o trabalho, mas nunca automatizo o julgamento.

• A publicação é manual. Eu aperto o botão. • Ir ao ar exige a minha presença. Eu aprovo cada pagamento ou configuração de lançamento. • Nada é mesclado em caso de falha. Um build quebrado bloqueia tudo.

A alavancagem da IA vem da automação de tarefas. A segurança vem de recusar a automação de decisões.

Quando você trabalha sozinho, seu recurso mais precioso é a confiança. Você deve confiar que o que você entregou é o que você pretendia entregar.

Comece pequeno. Encontre o erro que você comete com mais frequência. Construa uma verificação que torne esse erro impossível.

Fonte: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi

Como Gerencio Vários Apps Sozinho: O Agent Harness

Continuar lendo

A fronteira mais segura é aquela que o agente não consegue atravessar

Ninguém está revisando os PRs do seu robô

Seu agente de IA é tão seguro quanto as ferramentas que ele utiliza

Criando Agentes de IA Especializados

Quanta autonomia o seu agente de IA deve ter?