版权末日

诉讼正在增加。作者、艺术家和音乐家正在起诉 AI 公司。他们声称公司在未经许可的情况下使用他们的作品。这标志着“对一切内容进行 AI 训练”时代的终结。

当前一代 AI 使用海量的、未经授权的数据。下一代 AI 很可能会使用规模较小、合法的训练数据集。这一转变将改变一切。

法律之争

像新闻机构和作者这样的原告声称:

  • AI 公司未经许可使用受版权保护的作品。
  • AI 使用艺术家的姓名和肖像。
  • AI 产品与原创创作者展开竞争。

AI 公司通过以下理由进行辩护:

  • 训练属于“转换性使用”(transformative use)。
  • AI 学习的是模式,而不是直接复制。

控制权才是真正的核心问题。创作者希望拥有自己的作品并获得报酬。AI 公司则希望继续构建。法律仍处于追赶阶段。

“退出机制”的问题

存在像 Robots.txt 或 NoAI 标签这样的工具。它们允许创作者屏蔽 AI。但这其实是一个陷阱。

退出机制(Opt-out systems)将责任推给了创作者。你必须主动寻找工具并请求不要被采集。这并不等同于“同意”。真正的同意需要 AI 公司首先征得许可。

两种可能的未来

场景 1:乐观路径

AI 公司支付许可费用。他们会创建一个类似于文本版 Spotify 的系统。创作者获得报酬,模型保持强大。

场景 2:悲观路径

AI 公司败诉。他们必须删除其数据。由于缺乏信息,未来的模型能力将大幅下降。

对数据质量的新看法

数据减少通常意味着准确性和细微差别的降低。然而,当前的模型使用了大量的噪声。许多数据是冗余的。一个规模较小、干净的数据集实际上可能会产生更好的结果。

你可以如何准备

  • 关注诉讼。结果将定义整个行业。
  • 支持创作者。为你喜爱的内容付费。
  • 要求公平。AI 公司应该补偿提供数据的人。

如果你可以为 AI 训练构建一个公平的系统,它会如何运作?创作者应该如何获得报酬?

来源:https://dev.to/velocityai/the-copyright-apocalypse-why-training-on-everything-might-be-the-last-time-anyone-can-do-it-1a6k

可选学习社区:https://t.me/GyaanSetuAi