自动摘要的艺术

YouTube 创作者需要花费数小时查看原始素材。你需要在晃动的视频和无休止的闲聊中寻找故事。手动阅读转录文本非常浪费时间。你可以把这些时间花在剪辑或调色上。AI 自动摘要能将这种混乱转化为清晰的情节大纲 (beat sheet)。这让你在开始剪辑之前就能确认故事走向。

使用两个层面来寻找你的故事。首先,让 AI 充当故事编辑。这会为你提供逐章节的大纲,即你的宏观视角。其次,深入研究每个片段以寻找具体的情节点 (beats)。为这些情节点包含引用内容和时间戳。这就是你的微观视角。不要使用模糊的提示词。相反,要引导模型遵循你的视频流程。使用类似于“引入、问题、转折和解决”的结构。将情节点锚定到时间戳,可以创建一个用于故事审批的列表。这能确保在剪辑之前,每个人都对情感弧线达成共识。

工具亮点:使用 Whisper 获取干净的文本和能量图。能量图可以显示某个情节点是否与音频中的兴奋或沮丧情绪相匹配。这有助于你根据真实声音来校验 AI 的输出结果。

想象你有一段两小时的市场拍摄素材。运行 Whisper 后,你会得到一个分为四个部分的宏观大纲。然后,你要求提取第二部分中的微观情节点。你发现在 1:10:15 有一个沮丧的情节点,并附有准确的引用内容和匹配的能量峰值。

如何实现:

  • 准备转录文本:将素材通过 AI 转录服务运行,并检查错误。
  • 生成宏观大纲:要求 AI 对你的叙事弧线进行逐章节分解。
  • 提取微观情节点:请求带有标签、引用和时间戳的具体情节点。并根据能量图进行校验。

总结:

  • 分层提示词将转录文本转化为情节大纲。
  • 情感分析有助于根据情绪线索验证情节点。
  • 带时间戳的列表可以节省数小时的手动剪辑时间。

来源:https://dev.to/ken_deng_ai/the-art-of-the-auto-summary-generating-narrative-beats-from-chaos-3gea

可选学习社区:https://t.me/GyaanSetuAi