AI 政治偏见:为何即使是“反觉醒”聊天机器人也倾向于左翼
《华盛顿邮报》最近的一项调查揭示了 LLM 领域中一个持久的意识形态趋势:大多数主流 AI 模型都表现出显著的左倾偏见。即使是那些专门以保守或“寻求真相”为卖点的模型,也难以摆脱这一模式,这凸显了训练数据和对齐协议的深远影响。
左倾回答的主导地位
该调查对六种领先的 AI 模型进行了各种政治问题的测试,结果显示其观点明显向进步主义倾斜。OpenAI 的 GPT-5.5 表现最为偏颇,其 80% 的回答仅提供左倾论点。该模型频繁支持诸如对富人征收更高税收和单一支付者医疗体系等政策。
Deepseek 的 V4 Pro 紧随其后,在 70% 的测试案例中仅提供左倾回答。尽管 Gallup 的长期数据显示大多数美国人支持死刑,但 OpenAI 和 Deepseek 的模型都一致反对死刑。Anthropic 的 Claude Opus 4.8 则表现出更为温和的态度,43% 的情况下仅提供左倾回答,而在 57% 的情况下提供了平衡的观点。
“反觉醒”与保守派 AI 的悖论
最令人惊讶的发现之一是,那些明确旨在对抗所谓进步主义偏见的模型也未能成功。Elon Musk 的 xAI Grok 4.3 被定位为“反觉醒”和“寻求真相”的聊天机器人,但其产生的回答在大多数情况下仍然是纯粹的左倾观点。虽然它比竞争对手提供了更多的右倾回答,但仍未能保持一致的保守立场。
调查提出了两种可能的解释:这些模型是在与竞争对手相同的海量互联网规模数据集上进行训练的,或者它们在无意中从其他 AI 模型的输出中学习。此外,Gab 的 Arya 模型——声称基于基督教和保守主义原则构建——显示其提供左倾论点的频率比右倾论点高出 12 倍。然而,Grok 证明了对齐是可以进行人工引导的;它在跨性别权利问题上采取了纯粹的右倾立场,这与 Elon Musk 本人的公开立场一致,表明在特定的高关注度话题上存在刻意的干预。
Google Gemini:平衡的异类
虽然整个行业都在为中立性而挣扎,但 Google 的 Gemini 3.1 Pro 却成为了一个显著的例外。该模型展现出了卓越的平衡能力,在 93% 的情况下都能呈现问题的两面。只有 7% 的回答是纯粹左倾的,且从未默认采取纯粹的右倾立场。
Gemini 还展现出探索多元观点的独特能力,例如它能提供通过扩张军事来增强经济的论点——而其他模型未能提供这一视角。这表明 Google 的基于人类反馈的强化学习 (RLHF) 和系统提示词(system prompting)可能在多视角推理方面进行了更有效的调优。
为什么这对 AI 生态系统至关重要
随着 LLM 成为信息检索的主要接口,“中立性差距”正成为开发者和政策制定者关注的关键问题。如果底层数据或微调过程中应用的安全性层存在意识形态偏差,AI 可能会沦为“回声壁”,而非客观的工具。对于更广泛的领域而言,这凸显了将“安全对齐”与“意识形态对齐”区分开来的技术挑战,特别是当某些政治立场与科学共识或人权发生冲突时。
核心要点
- 广泛的偏见: OpenAI (GPT-5.5) 和 Deepseek (V4 Pro) 显示出最高水平的左倾偏见,分别为 80% 和 70%。
- 意识形态转向失败: 像 xAI 的 Grok 和 Gab 的 Arya 这样的“反觉醒”模型在很大程度上仍默认采用左倾观点,这可能是由于对训练数据的依赖。
- 中立性的例外: Google 的 Gemini 3.1 Pro 被证明是最平衡的模型,在 93% 的测试场景中提供了双向观点。
