Continuum bouwen: Een agent die volledige dramaseries regisseert

De meeste AI-tools maken één goede clip. Ze falen zodra je een serie probeert te maken. Personages zien er in elke shot anders uit. Dit maakt storytelling onmogelijk zonder dat een mens elk frame moet corrigeren.

Ik heb Continuum gebouwd om dit op te lossen. Het is een autonome AI-showrunner voor verticale micro-drama's. Het regelt het script, de storyboards, de video, de muziek en de montage. Het belangrijkste is dat personages er van de eerste tot de tweede aflevering hetzelfde uit blijven zien.

De markt voor verticale micro-drama's is enorm. Deze bereikte een waarde van $11 miljard in 2025. In China maakt 95% van de nieuwe titels gebruik van AI.

Continuum werkt met drie kernsystemen:

  • Een Series Bible: Dit JSON-document slaat het uiterlijk van personages, rekwisieten en locaties op. Zodra het uiterlijk van een personage is vastgelegd, kan de agent het gezicht niet meer veranderen. Dit voorkomt visuele drift.

  • Een Critic-Optimizer Loop: Nadat een clip is gegenereerd, vergelijkt Qwen-VL deze met het originele personage. Als de overeenkomst laag is, herschrijft de agent de prompt en probeert het opnieuw. De agent herstelt zijn eigen fouten.

  • Een Consistency Score: Ik gebruik een visuele beoordelaar om een numerieke waarde te geven aan de identiteitsmatch. Mijn demo van twee afleveringen behaalde een score van 0,98. De detective, zijn haar en zijn tatoeage bleven identiek in alle scènes.

Technische Stack:

  • Scripting en optimalisatie: Qwen3-max
  • Visuele critic: Qwen-VL
  • Videogeneratie: Wan text-to-video via Qwen Cloud
  • Backend: FastAPI op Alibaba Cloud

Tijdens de bouw heb ik drie belangrijke lessen geleerd:

  1. Ga om met API-fouten: Ik kreeg te maken met willekeurige 503-fouten van de video-API. In plaats van mijn logica steeds te herschrijven, begon ik een retry-systeem te bouwen. Hierdoor veranderde een kapotte pipeline in een systeem dat zonder toezicht kan draaien.

  2. Beheer je kosten: Videogeneratie is duur. Ik gebruikte een resolutie van 720p en stelde strikte budgetlimieten in om binnen het budget te blijven.

  3. Focus op je moat: De waarde zit niet in de video. De waarde zit in het geheugen dat het verhaal coherent houdt.

De volgende stappen omvatten het toevoegen van lip-syncing en een karakterbibliotheek voor nog betere retrieval.

Code: https://github.com/calderbuild/continuum

Source: https://dev.to/jasonrobertdestiny/building-continuum-an-agent-that-shoots-a-whole-drama-series-not-one-clip-4g3o

Optional learning community: https://t.me/GyaanSetuAi