A IA escreve código. Ela não consegue definir o que é "pronto".

Eu construí um gerador de apresentações de slides com IA. Você digita um tópico e recebe uma apresentação.

A demonstração da IA funcionou instantaneamente. Ela escreveu um esboço. Criou os slides. Exportou um arquivo. Na minha tela, parecia terminado.

Não estava terminado.

A IA provou que um usuário poderia criar um deck uma única vez. Um produto real é diferente. Ele precisa lidar com 100 usuários ao mesmo tempo. Precisa cobrá-los corretamente. Precisa se recuperar quando uma etapa falha. Precisa exportar um arquivo que realmente abra no PowerPoint.

A IA não adicionou essas coisas porque eu não disse para ela fazer isso.

Quando você constrói algo com IA, a parte difícil não é descrever a funcionalidade. A parte difícil é definir o que significa estar "pronto".

Usei o Velobase Harness para a base. Ele cuidou da autenticação, pagamentos, créditos e bancos de dados. Isso me permitiu focar a IA na geração do PPT em si.

Foi aí que o "parece pronto" e o "está pronto" se distanciaram. Encontrei quatro lacunas principais:

  • Concorrência: A IA pensa que uma execução bem-sucedida equivale a uma funcionalidade concluída. Um sistema real precisa dividir as tarefas em filas. Você deve gerar cada slide como um trabalho individual para que os workers possam escalar.

  • Faturamento: A IA deduz os créditos uma vez e para. Um produto real precisa de uma máquina de estados. Você deve reservar créditos, liquidar com base no uso real e reembolsar em caso de falha.

  • Autorrevisão: Se o backend tentar uma tarefa novamente de forma silenciosa, o usuário verá apenas um ícone de carregamento. Você deve mostrar o status. O usuário deve ver "verificando" ou "redesenhando" para saber que o sistema está trabalhando.

  • Exportação: Um slide pode parecer ótimo no navegador, mas quebrar em um arquivo PPTX. O requisito não é apenas criar um arquivo. O requisito é que o arquivo corresponda à pré-visualização na web.

Mudei minhas instruções. Parei de dar à IA uma lista de funcionalidades. Comecei a dar a ela critérios de aceitação.

Minhas novas regras para a IA:

  • Construir um SaaS pronto para produção, não uma demonstração.
  • Suportar 100 usuários simultâneos.
  • Usar filas independentes para o planejamento e a criação de slides.
  • Conectar cada chamada de modelo ao sistema de faturamento.
  • Pausar e retomar tarefas com base no saldo de créditos.
  • Executar verificações de layout após cada slide.
  • Garantir que a exportação em PPTX corresponda à pré-visualização.
  • Escrever testes para concorrência e falha, não apenas para o sucesso.

A IA escreve código rápido. Ela apenas não sabe o que torna um código pronto para ser lançado. Ela trata uma demonstração local como um sistema completo.

O papel humano é fornecer os limites de engenharia, os casos de falha e as regras de negócio.

O Harness fornece a base SaaS. A IA preenche a lógica. Você só precisa fornecer o input mais preciso.

Se você lançou um produto construído por IA, qual foi a maior lacuna entre "funciona" e "está pronto para os clientes"?

Fonte: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6