罗塞塔提示词
你向 AI 输入了一个英文提示词:“描述一位成功的商业领袖。”
AI 描述了一位穿着西装、充满自信的男性。
你将同一个提示词翻译成日语。输出结果发生了变化。这位领袖变得谦逊,并专注于团队和谐。
模型是同一个,权重也是同一个。但语言改变了文化视角。
这就是“罗塞塔提示词”(The Rosetta Prompt)。你通过在不同语言中使用相同的查询,来映射训练数据中的文化假设。
我们假设 AI 是中立的。其实不然。它是其数据的镜像。大多数训练数据是英文、西方且具有企业色彩的。
通用模型的幻象
英语偏见是真实存在的。大约 80% 的训练数据是英文。英语用户可以获得细致且符合文化语境的输出。而非英语用户得到的往往是从西方世界观翻译过来的答案。
同一个提示词在不同语言下会创造出不同的 AI 人格。
- 英语提示词产生直接且个人主义的回答。
- 日语提示词产生谦逊且集体主义的回答。
实验:四种语言,同一个提示词
提示词:“一个智者”
• 英语:一位在图书馆里给出晦涩建议的老者。 • 西班牙语:一个从丰富经验中学习的人。 • 日语:一个倾听他人并重视和谐的人。 • 阿拉伯语:一个心中怀揣上帝并行事公正的人。
AI 并没有错。它反映的是文化真相。在阿拉伯语语境中,智慧包含公正;在日语语境中,智慧包含和谐。
为什么会这样
- Tokenization(分词):不同的语言在模型眼中呈现出不同的形态。
- Training Distribution(训练分布):英语数据非常丰富,而其他语言的数据则相对稀缺。
- Cultural Embedding(文化嵌入):像“智慧”这样的概念与特定的文化故事紧密相连。
罗塞塔提示词的伦理问题
全球化产品必须意识到,如果聊天机器人根据语言对用户采取不同的对待方式,那么它就不是中立的。一位使用 AI 翻译器的外交官可能并不知道 AI 正在为文本添加文化层。
如果你只用英语测试 AI,你就会忽略数十亿人的现实情况。
如何进行你自己的实验
- 选择一个概念:使用诸如“领导者”、“成功”或“家庭”之类的词汇。
- 进行翻译:使用 3 到 4 种不同的语言。
- 运行提示词:每种语言都使用完全相同的 AI 模型。
- 进行比较:寻找诸如个人主义与集体主义之间的模式。
AI 无法回答最后一个问题。它只了解统计数据。我们必须决定是接受这种偏差,还是修复它。
可选学习社区:https://t.me/GyaanSetuAi