为什么我要构建 doll

高性能 AI 如今触手可及。但这种访问权并非一劳永逸。

价格会变动。使用限制会增加。供应商可能会关闭服务或更改政策。即使你的 AI 环境昨天还能正常运行,今天也可能突然丢失。

问题不在于信任,而在于控制。你的 AI 连续性取决于你并不拥有的东西。

我开始构建 doll。它是一个开源的个人 AI 连续性系统。

doll 不是一个新模型。它不会取代 Ollama 或 LM Studio 之类的工具。它的目标是保护你的个人 AI 环境。你需要确保即使在模型或应用发生变化时,你的数据依然可用。

大多数人认为模型是 AI 的核心。事实并非如此。模型仅仅是一个推理引擎,你可以随时更换它。

真正的核心是你的状态(state)。这包括:

  • 长期记忆与偏好。
  • 对话历史与来源。
  • 研究记录与项目历史。
  • 权限与策略。
  • 备份与迁移记录。

新模型可能更好。出于隐私考虑,本地模型可能是必需的。当你切换模型时,你不应该丢失历史记录。

本地运行有利于隐私和成本。但本地应用也可能导致锁定(lock-in)。如果一个应用停止工作或更改了其格式,你就会丢失数据。

doll 不依赖于任何单一格式。它不使用 ChatGPT 或 Ollama 的格式作为标准。相反,它将数据映射到一种有文档记录的表示形式中。如果在导入过程中丢失了数据,doll 会告知你。

原则很简单:本地完备,云端可选。

你的系统必须在没有 API 密钥或互联网连接的情况下也能工作。云端模型只是为了提升性能而提供的可选工具。云端永远不应该是你的身份、文件或记忆的唯一事实来源(source of truth)。

doll 目前处于 pre-alpha 阶段。它还不是一个日常助手。在连接模型之前,我正在构建其边界。

我正专注于:

  • 将记忆与机密分离。
  • 防止日志中的机密泄露。
  • 区分事实与推论。
  • 记录信息的来源。
  • 对高风险任务要求用户确认。

我想定义在技术变革时,哪些东西必须得以延续。

如果你是一名开发者,比起支持,我更需要你的批评。

  • 用户状态在哪里结束,模型状态又从哪里开始?
  • 在不同的 AI 工具之间切换时,会丢失哪些信息?
  • 如果主设备消失了,系统真的能够完全恢复吗?
  • doll 会成为一种新型的锁定形式吗?

项目网站:https://doll.badjoke-lab.com/

源代码:https://github.com/badjoke-lab/doll

完整文章:https://dev.to/badjoke-lab/why-im-building-doll-a-personal-ai-continuity-system-1a1c

可选的学习社区:https://t.me/GyaanSetuAi