为什么你的 AI 置信度评分会撒谎

Translated for your language. 阅读原文.

AI-assisted draft.

昨天1分钟阅读

为什么你的 AI 置信度分数在撒谎

你训练了模型。指标看起来很棒。你部署了它。

六个月后，出问题了。你的准确率仪表板看起来没问题，但模型正在失效。

这是由于分布偏移（distribution shift）造成的。生产环境中的数据与你的训练数据不同。这种偏移破坏了校准（calibration）。

如果你使用混合专家（Mixture-of-Experts, MoE）架构，你会面临一个特定的风险。

校准意味着如果模型说它有 80% 的置信度，那么它在 80% 的情况下是正确的。在采用软路由（soft routing）的 MoE 模型中，这种校准会悄无声息地失效。

软路由通过融合多个专家来获得结果。即使每个专家都是经过校准的，当输入数据发生变化时，组合后的分数也会变得不可靠。会出现模型在训练期间未见过的不同路由模式。

硬路由（Hard routing）更加稳健。它只将输入发送给一个专家。置信度与该特定专家保持绑定。

如何修复：

使用对抗性重加权 (Adversarial Reweighting)：在困难样本上训练模型。在训练期间使用指数倾斜 (exponential tilt) 来强调高损失样本。
使用稳健过滤损失 (Robust Filtered Loss)：将训练重点放在专家融合表现不如单个专家的案例上。

当前应对措施：

校准是一种系统属性。经过校准的局部并不一定能构成一个经过校准的整体。

你在生产环境中遇到过校准漂移吗？在评论区分享你的监控方案。

Optional learning community: https://t.me/GyaanSetuAi

继续阅读