权重之中：在大语言模型时代衡量你的数字遗产

Translated for your language. 阅读原文.

AI-assisted draft.

本文目录

In the Weights：在大语言模型时代衡量你的数字遗产

随着网络搜索引擎逐渐失去其作为主要事实来源的地位，一个新的数字前沿正在兴起：大语言模型的内部参数。“In the Weights”是一款新颖的自我搜索工具，它允许用户发现自己的存在是否已被刻入人工智能的底层架构之中。

超越 Google：基于大语言模型的身份识别兴起

几十年来，“谷歌搜索自己”一直是检查个人数字足迹的标准做法。然而，随着越来越多的用户从传统搜索引擎转向对话式人工智能，在线存在感的概念正在发生演变。Thomas Dimson 和 Joey Flynn（通过收购 Global Illumination 成为前 OpenAI 成员）推出了 “In the Weights” 来应对这一转变。

该平台不再依赖已索引的网页，而是专注于“权重（weights）”——即定义人工智能模型智能程度的数值参数。其目标是衡量模型在没有实时网络搜索工具辅助的情况下，对特定个人的回忆能力，本质上是在测试一个人的数据是否已深度嵌入模型的训练集中。

评分机制是如何运作的

该工具通过查询一系列领先的大语言模型来运行，包括 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Meta 的 Llama 以及 xAI 的 Grok。其提示词结构非常精确：它询问模型，“[姓名]是谁？请给出最多10个结果，每个结果包含一段简短描述和置信度。”

一旦收集到数据，平台会执行三个关键的技术步骤：

聚类 (Clustering)： 将来自不同模型的相似描述进行分组。
强度评分 (Strength Scoring)： 根据回忆的一致性和清晰度分配数值评分。
幻觉检测 (Hallucination Detection)： 标记出不一致之处，例如当 GPT-4o Mini 等模型提供模糊或错误的数据时。

排行榜反映了权重中可用信息的密度。虽然像 Macaulay Culkin（得分为 988）和 Luciano Pavarotti 这样的名人占据了榜单前列，但该工具也为科技从业者等普通用户提供了一个比较标准，让他们了解自己在“AI 大脑”中的排名。

为什么这对于人工智能领域具有重要意义

"In the Weights" 不仅仅是一个走红的趣闻；它是观察训练数据社会学影响的一个窗口。该项目揭示了人类生活本质上是如何被编码为浮点数的。通过分析结果，创作者旨在探讨更深层次的技术和伦理问题，例如哪些模型表现出特定的偏见，以及哪些个体拥有显著的文化足迹却缺乏维基百科词条。

随着大语言模型（LLMs）成为信息检索的主要接口，了解其权重中捕捉到了什么——以及没有捕捉到什么——对于研究人员、内容创作者以及关注在后搜索时代长期数字遗产的个人来说，将至关重要。

核心要点

数字身份的转变： 随着流量从搜索引擎转向 LLMs，“虚荣性搜索”正从网页索引转向检查模型参数。
跨模型基准测试： 该工具提供了一种独特的方式，用于比较不同架构（GPT、Claude、Llama 等）如何召回特定信息。
数据编码： 该项目强调了一个现实：海量的人类信息现在正以数值权重的形式存储在神经网络中。