为什么 AI 需要状态管理，而非更大的上下文窗口

Machine-translated. Read the original.

📅2 hours ago⏱2 min read

为什么 AI 需要状态管理，而非更大的上下文窗口

新模型发布时都配备了海量的上下文窗口。人们的假设很简单：在单次请求中加入更多数据就能解决所有问题。

你添加更多的文档。你添加更多的历史记录。你添加更多的工作流数据。

但在将 AI 应用于生产环境后，我们吸取了一个教训。上下文窗口确实有帮助。但状态管理更为重要。

当 AI 生成的结果不佳时，团队往往会向 prompt 中添加更多信息。他们认为模型需要更多的历史记录或更多的业务上下文。于是，prompt 变得越来越臃肿。

信息增多并不意味着决策质量的提升，往往适得其反。巨大的上下文窗口掩盖了糟糕的架构设计。系统不再筛选相关数据，而是把所有东西都塞进去。

这会引发一系列问题：

模型拥有的信息更多了，但清晰度却降低了。

你必须理解 context（上下文）与 state（状态）之间的区别。 Context 是单次请求中可用的信息。 State 是系统随时间推移而掌握的信息。

State 的示例：

这些信息并不需要存在于每一个 prompt 中。分布式系统并不会通过将所有数据到处传递来解决复杂性。它们使用数据库、缓存和队列来管理状态。

AI 系统往往忽略了这一原则。它们将上下文窗口视为临时数据库。这是一种架构上的懒惰。

不要再问“我们能把所有东西都塞进去吗？” 而要开始问“需要哪些信息？”

我们发现，通过改进状态管理而非增加上下文大小，可以获得更好的效果。我们通过以下方式实现了这一点：

这带来了更低的成本和更快的执行速度。它不需要更大的模型。它需要更好的设计。

目标不是让模型访问所有信息。目标是在正确的时间给模型提供正确的信息。

Optional learning community: https://t.me/GyaanSetuAi

Continue reading