版权末日
诉讼正在增加。作者、艺术家和音乐家正在起诉 AI 公司。他们声称公司在未经许可的情况下使用他们的作品。这标志着“对一切内容进行 AI 训练”时代的终结。
当前一代 AI 使用海量的、未经授权的数据。下一代 AI 很可能会使用规模较小、合法的训练数据集。这一转变将改变一切。
法律之争
像新闻机构和作者这样的原告声称:
- AI 公司未经许可使用受版权保护的作品。
- AI 使用艺术家的姓名和肖像。
- AI 产品与原创创作者展开竞争。
AI 公司通过以下理由进行辩护:
- 训练属于“转换性使用”(transformative use)。
- AI 学习的是模式,而不是直接复制。
控制权才是真正的核心问题。创作者希望拥有自己的作品并获得报酬。AI 公司则希望继续构建。法律仍处于追赶阶段。
“退出机制”的问题
存在像 Robots.txt 或 NoAI 标签这样的工具。它们允许创作者屏蔽 AI。但这其实是一个陷阱。
退出机制(Opt-out systems)将责任推给了创作者。你必须主动寻找工具并请求不要被采集。这并不等同于“同意”。真正的同意需要 AI 公司首先征得许可。
两种可能的未来
场景 1:乐观路径
AI 公司支付许可费用。他们会创建一个类似于文本版 Spotify 的系统。创作者获得报酬,模型保持强大。
场景 2:悲观路径
AI 公司败诉。他们必须删除其数据。由于缺乏信息,未来的模型能力将大幅下降。
对数据质量的新看法
数据减少通常意味着准确性和细微差别的降低。然而,当前的模型使用了大量的噪声。许多数据是冗余的。一个规模较小、干净的数据集实际上可能会产生更好的结果。
你可以如何准备
- 关注诉讼。结果将定义整个行业。
- 支持创作者。为你喜爱的内容付费。
- 要求公平。AI 公司应该补偿提供数据的人。
如果你可以为 AI 训练构建一个公平的系统,它会如何运作?创作者应该如何获得报酬?
可选学习社区:https://t.me/GyaanSetuAi
