In the Weights:在大语言模型时代衡量你的数字遗产
随着网络搜索引擎逐渐失去其作为主要事实来源的地位,一个新的数字前沿正在兴起:大语言模型的内部参数。“In the Weights”是一款新颖的自我搜索工具,它允许用户发现自己的存在是否已被刻入人工智能的底层架构之中。
超越 Google:基于大语言模型的身份识别兴起
几十年来,“谷歌搜索自己”一直是检查个人数字足迹的标准做法。然而,随着越来越多的用户从传统搜索引擎转向对话式人工智能,在线存在感的概念正在发生演变。Thomas Dimson 和 Joey Flynn(通过收购 Global Illumination 成为前 OpenAI 成员)推出了 “In the Weights” 来应对这一转变。
该平台不再依赖已索引的网页,而是专注于“权重(weights)”——即定义人工智能模型智能程度的数值参数。其目标是衡量模型在没有实时网络搜索工具辅助的情况下,对特定个人的回忆能力,本质上是在测试一个人的数据是否已深度嵌入模型的训练集中。
评分机制是如何运作的
该工具通过查询一系列领先的大语言模型来运行,包括 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Meta 的 Llama 以及 xAI 的 Grok。其提示词结构非常精确:它询问模型,“[姓名]是谁?请给出最多10个结果,每个结果包含一段简短描述和置信度。”
一旦收集到数据,平台会执行三个关键的技术步骤:
- 聚类 (Clustering): 将来自不同模型的相似描述进行分组。
- 强度评分 (Strength Scoring): 根据回忆的一致性和清晰度分配数值评分。
- 幻觉检测 (Hallucination Detection): 标记出不一致之处,例如当 GPT-4o Mini 等模型提供模糊或错误的数据时。
排行榜反映了权重中可用信息的密度。虽然像 Macaulay Culkin(得分为 988)和 Luciano Pavarotti 这样的名人占据了榜单前列,但该工具也为科技从业者等普通用户提供了一个比较标准,让他们了解自己在“AI 大脑”中的排名。
为什么这对于人工智能领域具有重要意义
"In the Weights" 不仅仅是一个走红的趣闻;它是观察训练数据社会学影响的一个窗口。该项目揭示了人类生活本质上是如何被编码为浮点数的。通过分析结果,创作者旨在探讨更深层次的技术和伦理问题,例如哪些模型表现出特定的偏见,以及哪些个体拥有显著的文化足迹却缺乏维基百科词条。
随着大语言模型(LLMs)成为信息检索的主要接口,了解其权重中捕捉到了什么——以及没有捕捉到什么——对于研究人员、内容创作者以及关注在后搜索时代长期数字遗产的个人来说,将至关重要。
核心要点
- 数字身份的转变: 随着流量从搜索引擎转向 LLMs,“虚荣性搜索”正从网页索引转向检查模型参数。
- 跨模型基准测试: 该工具提供了一种独特的方式,用于比较不同架构(GPT、Claude、Llama 等)如何召回特定信息。
- 数据编码: 该项目强调了一个现实:海量的人类信息现在正以数值权重的形式存储在神经网络中。