Construindo o Continuum: Um Agente que Filma Séries Dramáticas Inteiras
A maioria das ferramentas de IA cria apenas um clipe de qualidade. Elas falham quando você tenta criar uma série. Os personagens parecem diferentes em cada cena. Isso torna a narrativa impossível sem que um humano precise corrigir cada quadro.
Eu construí o Continuum para resolver isso. É um showrunner de IA autônomo para microdramas verticais. Ele cuida do roteiro, storyboards, vídeo, música e edição. O mais importante: ele mantém a aparência dos personagens igual do primeiro para o segundo episódio.
O mercado de microdramas verticais é enorme. Atingiu US$ 11 bilhões em 2025. Na China, 95% dos novos títulos usam IA.
O Continuum funciona usando três sistemas principais:
Uma Bíblia da Série: Este documento JSON armazena a aparência dos personagens, objetos (props) e locações. Uma vez definida a aparência de um personagem, o agente não pode mudar o rosto. Isso evita a deriva visual.
Um Loop de Crítico-Otimizador: Após a geração de um clipe, o Qwen-VL o compara com o personagem original. Se a correspondência for baixa, o agente reescreve o prompt e tenta novamente. O agente corrige seus próprios erros.
Uma Pontuação de Consistência: Utilizo um juiz visual para fornecer um número real de correspondência de identidade. Minha demonstração de dois episódios obteve uma pontuação de 0,98. O detetive, seu cabelo e sua tatuagem permaneceram idênticos entre as cenas.
Stack Técnica:
- Roteirização e Otimização: Qwen3-max
- Crítico Visual: Qwen-VL
- Geração de Vídeo: Wan text-to-video via Qwen Cloud
- Backend: FastAPI no Alibaba Cloud
Aprendi três grandes lições durante este desenvolvimento:
Lide com erros de API: Enfrentei erros 503 aleatórios da API de vídeo. Parei de reescrever minha lógica e comecei a construir um sistema de retentativa (retry). Isso transformou um pipeline quebrado em um pipeline autônomo.
Controle seus custos: A geração de vídeo é cara. Usei resolução 720p e defini limites rígidos de gastos para permanecer dentro do orçamento.
Foque no diferencial (moat): O valor não está no vídeo. O valor está na memória que mantém a história coerente.
Os próximos passos envolvem adicionar sincronia labial (lip-syncing) e uma biblioteca de personagens para uma recuperação ainda melhor.
Código: https://github.com/calderbuild/continuum
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
