ByteDanceがSeedance 2.5を発表:長尺AIビデオの新時代へ

ByteDanceは、長尺のAIビデオクリップを生成可能な画期的なモデル「Seedance 2.5」を発表し、生成メディアの限界を押し広げようとしています。Volcano Engine FORCEカンファレンスで公開されたこの新モデルは、プロのクリエイターにとって、時間的な一貫性とクリエイティブな制御における大きな飛躍を意味します。

30秒の壁を打破

Seedance 2.5の最も重要な成果は、1回の生成プロセスで最大30秒のビデオクリップを生成できる能力です。複数の短いクリップを「繋ぎ合わせる(stitching)」必要があった従来のAIビデオモデル(このプロセスでは視覚的なちらつきや連続性のエラーが頻繁に発生していました)とは異なり、Seedance 2.5は複雑なトランジションをネイティブに処理します。このモデルは、単一の生成内で意図的なシーン転換やテンポの変化を実行できるため、流れるような映画的な体験を保証します。

クリエイティブな精度を高めるため、Seedance 2.5は最大50個の同時追加入力をサポートしています。これにより、ユーザーはリファレンス画像、特定のオーディオファイル、その他のマルチモーダルデータをモデルに提供できます。映画制作者や制作会社にとって、この機能は複数のキャラクターが登場するシーンや特定の環境要件を伴うシーンを演出する際に極めて重要であり、従来のコンシューマー向け生成AIでは見られなかったレベルのきめ細かな制御を可能にします。

向上した視覚的忠実度と生成後の編集機能

生成時間の延長に加え、ByteDanceは視覚的な基準もアップグレードしています。既存のSeedance 2.0モデルは、10ビットの色深度を持つネイティブ4K解像度をサポートし、プロフェッショナルな放送や映画のワークフローに求められるハイダイナミックレンジを提供します。

さらに、ByteDanceは高度な生成後編集機能も導入しています。ユーザーは、元の視覚的なスタイルや美的な整合性を維持したまま、生成されたビデオ内の要素を変更できるようになりました。これにより、AIビデオ制作における最大の悩みの一つである「元の『ルック』を失わずに、シーケンス全体を再生成することなく軽微なエラーを修正できない」という問題が解決されます。

包括的なマルチモーダル・エコシステム

Seedanceの発表は、ByteDanceのエンタープライズ向けクラウド事業であるVolcano Engineを通じて展開される、5つの新しいAIモデルの広範なロールアウトの一部です。このエコシステムは、開発者や企業にフルスタックのツールキットを提供できるように設計されています。

  • Doubao 2.1 Pro: Claude Opus 4.6よりもコストが約80%低いと報告されている高性能言語モデルであり、ByteDanceをコスト効率の高いLLM市場における主要な競合へと位置づけています。
  • Seedream 5.0 Pro: 高忠実度なビジュアルアセットのための高度な画像生成モデル。
  • Seed-Audio 1.0: ビデオおよびテキストのワークフローを補完する専用オーディオモデル。

これらのモデルを統合することで、ByteDanceは単一のツールをリリースするだけでなく、次世代の自動コンテンツ制作を支えるために設計された、まとまりのあるマルチモーダルエンジンを提供しようとしています。

主なポイント

  • 継続性の延長: Seedance 2.5は30秒の壁を打破し、後からの繋ぎ合わせを必要とせず、ネイティブなシーン転換を伴う長尺ビデオを生成します。
  • マルチモーダル制御: 画像やオーディオを含む最大50個の同時入力を受け付け、複雑なキャラクターやシーンの管理を可能にします。
  • エンタープライズ・スケーリング: ByteDanceは価格とパフォーマンスで積極的に競争しており、Doubao 2.1 Pro LLMはAnthropicのような業界リーダーに対して大きなコスト優位性を提供しています。