为什么我要构建 doll
高性能 AI 如今触手可及。但这种访问权并非一劳永逸。
价格会变动。使用限制会增加。供应商可能会关闭服务或更改政策。即使你的 AI 环境昨天还能正常运行,今天也可能突然丢失。
问题不在于信任,而在于控制。你的 AI 连续性取决于你并不拥有的东西。
我开始构建 doll。它是一个开源的个人 AI 连续性系统。
doll 不是一个新模型。它不会取代 Ollama 或 LM Studio 之类的工具。它的目标是保护你的个人 AI 环境。你需要确保即使在模型或应用发生变化时,你的数据依然可用。
大多数人认为模型是 AI 的核心。事实并非如此。模型仅仅是一个推理引擎,你可以随时更换它。
真正的核心是你的状态(state)。这包括:
- 长期记忆与偏好。
- 对话历史与来源。
- 研究记录与项目历史。
- 权限与策略。
- 备份与迁移记录。
新模型可能更好。出于隐私考虑,本地模型可能是必需的。当你切换模型时,你不应该丢失历史记录。
本地运行有利于隐私和成本。但本地应用也可能导致锁定(lock-in)。如果一个应用停止工作或更改了其格式,你就会丢失数据。
doll 不依赖于任何单一格式。它不使用 ChatGPT 或 Ollama 的格式作为标准。相反,它将数据映射到一种有文档记录的表示形式中。如果在导入过程中丢失了数据,doll 会告知你。
原则很简单:本地完备,云端可选。
你的系统必须在没有 API 密钥或互联网连接的情况下也能工作。云端模型只是为了提升性能而提供的可选工具。云端永远不应该是你的身份、文件或记忆的唯一事实来源(source of truth)。
doll 目前处于 pre-alpha 阶段。它还不是一个日常助手。在连接模型之前,我正在构建其边界。
我正专注于:
- 将记忆与机密分离。
- 防止日志中的机密泄露。
- 区分事实与推论。
- 记录信息的来源。
- 对高风险任务要求用户确认。
我想定义在技术变革时,哪些东西必须得以延续。
如果你是一名开发者,比起支持,我更需要你的批评。
- 用户状态在哪里结束,模型状态又从哪里开始?
- 在不同的 AI 工具之间切换时,会丢失哪些信息?
- 如果主设备消失了,系统真的能够完全恢复吗?
- doll 会成为一种新型的锁定形式吗?
项目网站:https://doll.badjoke-lab.com/
源代码:https://github.com/badjoke-lab/doll
完整文章:https://dev.to/badjoke-lab/why-im-building-doll-a-personal-ai-continuity-system-1a1c
可选的学习社区:https://t.me/GyaanSetuAi