超越视频垃圾：为何好莱坞的 AI 未来取决于人类协同

Translated for your language. 阅读原文.

AI-assisted draft.

本文目录

超越视频废料：为何好莱坞的 AI 未来取决于人机协同

好莱坞围绕生成式 AI 的炒作曾许诺了一场革命，然而目前的产出往往不过是视觉不连贯的“视频废料”。随着各大制片厂努力弥合硅谷模型快速迭代与电影叙事需求之间的鸿沟，一种新的模式正从 Tribeca 电影节等实验性展示中显现出来。

基础生成式模型的局限性

迄今为止，由 OpenAI 和 xAI 等公司驱动的、充斥在互联网上的大部分生成式 AI 内容，都无法达到专业娱乐的标准。这些模型主要只能产生短促、支离破碎的片段，缺乏时序一致性和叙事深度。对于制作公司而言，“基础型”提示词往往会导致内容显得毫无生气，缺乏高规格电影制作所需的创作意图。

业界已经见识到了这项技术的波动性；随着制片厂意识到目前还无法依赖硅谷视频生成能力的现有发展轨迹，几项备受瞩目的好莱坞与 AI 的合作伙伴关系已经破裂。问题不仅在于像素质量，更在于简单的文本提示词无法产生连贯的电影视觉构想。

来自 Tribeca 的启示：人机协作

虽然纯 AI 生成的电影往往举步维艰，但今年 Tribeca 电影节展示的项目为一种更高级的方法提供了蓝图。其区别在于如何将技术融入创作过程，而不是将其作为创作的替代品。

然而，即使是实验性作品也面临着巨大的障碍。例如，Illuminai Studios 的动画短片 Roar 就是一个警示案例。尽管该片在技术上极具野心，但感觉更像是一段由 AI 生成片段组成的、令人迷失方向的蒙太奇，而非一部统一的电影作品。这凸显了叙事中的“恐怖谷”效应：即使视觉效果惊人，如果缺乏人类驱动的叙事主线，也会让观众感到脱节。

从“生成”转向“增强”

AI 在电影领域的真正未来并不在于“凭空炮制一部电影”。相反，开发者和电影制作人的价值主张将在于能够增强人类艺术创造力的工具。最成功的应用很可能是那些能够解决特定制作瓶颈（如视觉特效、背景生成或分镜设计）的工具，同时让导演和艺术家能够完全掌控情感和结构走向。

对于 AI 领域而言，这意味着从通用视频模型向提供精准度和一致性的专业化、可控化工具的转型。行业正在告别“通过提示词生成电影”的时代，迈向“AI 辅助电影摄影”的时代，在这一时代，模型是乐器而非指挥家。

核心要点

一致性差距： 目前各大 AI 公司推出的生成式模型会产生视觉上不一致的“废料 (slop)”，缺乏专业电影制作所需的时序连贯性。
以人为本的集成： AI 在电影领域的成功应用取决于艺术家将技术作为增强工具，而非试图将整个创作过程自动化。
超越提示词： 电影技术的未来在于高精度、可控的工具，这些工具允许创作具有意图性，而非依赖原生生成模型那不可预测的输出。