字节跳动发布 Seedance 2.5:开启长视频 AI 新时代

字节跳动通过发布 Seedance 2.5 正在突破生成式媒体的边界,这是一款能够制作长篇 AI 视频片段的突破性模型。该模型在火山引擎 FORCE 大会上亮相,标志着在时间一致性和专业创作者创意控制方面实现了重大飞跃。

打破 30 秒限制

Seedance 2.5 最显著的成就之一是能够在单次生成中制作长达 30 秒的单个视频片段。以往的 AI 视频模型通常需要将多个短片段“拼接”在一起——这一过程往往会导致视觉闪烁或连贯性错误——而 Seedance 2.5 则能够原生处理复杂的过渡。该模型可以在单次生成中执行有意的场景切换和节奏变化,确保流畅的电影级体验。

为了增强创作精度,Seedance 2.5 支持多达 50 个同步输入的附加信息。这允许用户向模型提供参考图像、特定音频文件和其他多模态数据。对于电影制作人和制作公司而言,在导演涉及多角色或特定环境要求的场景时,这种能力至关重要,因为它提供了消费级生成式 AI 之前从未实现过的细粒度控制。

增强的视觉保真度与生成后编辑

除了延长视频时长,字节跳动还在升级其视觉标准。现有的 Seedance 2.0 模型现在支持原生 4K 分辨率和 10 位色深,能够提供专业广播和电影工作流所需的高动态范围。

此外,字节跳动正在引入先进的生成后编辑功能。用户现在可以在保持原始视觉风格和美学完整性的同时,修改生成视频中的元素。这解决了 AI 视频制作中的一大痛点:无法在不重新生成整个序列并丢失原始“质感”的情况下修复微小错误。

全面的多模态生态系统

Seedance 的发布是字节跳动面向企业的云业务——火山引擎通过推出五款全新 AI 模型所构建的更广泛布局的一部分。该生态系统旨在为开发者和企业提供全栈工具包:

  • Doubao 2.1 Pro: 一款高性能语言模型,据报道其成本比 Claude Opus 4.6 低约 80%,使字节跳动成为高性价比 LLM 市场的主要竞争者。
  • Seedream 5.0 Pro: 用于生成高保真视觉资产的高级图像生成模型。
  • Seed-Audio 1.0: 用于补充视频和文本工作流的专用音频模型。

通过整合这些模型,字节跳动不仅仅是在发布单一工具,而是在打造一个凝聚的多模态引擎,旨在为下一代自动化内容创作提供动力。

核心要点

  • 延长的连贯性: Seedance 2.5 打破了 30 秒的限制,能够生成具有原生场景切换的长视频,无需后期拼接。
  • 多模态控制: 该模型支持多达 50 个同步输入(包括图像和音频),从而实现复杂的角色和场景管理。
  • 企业级规模化: 字节跳动正在价格和性能方面展开激烈竞争,其 Doubao 2.1 Pro LLM 相比 Anthropic 等行业领导者具有显著的成本优势。