智能体工程的兴起:提示词债务

用纯英文编写提示词感觉像魔法。你输入想要的内容,原型就出现了。但对于长期系统来说,这种魔法会变成一个陷阱。

你可能正在积累提示词债务。

当你使用自然语言而非精确工程来控制模型时,就会产生提示词债务。这会带来三个巨大的问题:

  • 迭代速度变慢。你为了修复一个错误而添加更多文本,但这些文本又破坏了其他地方。很快,你的提示词就会变成一堆重复指令的乱麻。
  • 团队失去控制。一个充满了全大写警告和边缘情况的提示词,同事根本无法阅读或管理。
  • 被锁定在单一模型中。为某个模型调优的提示词在更新、更好的版本上往往会失效。团队因为担心破坏系统,而不得不停留在旧的、昂贵的模型上。

这是因为你正在与权重(weights)对抗。当模型抵制你的指令时,你会重复它。每一次重复或强调的指令都是“疤痕组织”。它展示了模型的训练是如何与你的意图相冲突的。

自然语言对于工程来说太不精确了。措辞的微小变化可能会扭转模型的行为。甚至提示词中无关的事实也会改变模型的响应方式。

如何解决这个问题?

你必须停止手动编写提示词,开始通过度量指标来规定行为。

  • 提示词是你希望模型遵循的一段话。
  • 指标是模型必须满足的契约。

工程的未来正从“提示(prompting)”转向“编程(programming)”。像 DSPy 和 GEPA 这样的工具允许你定义目标和指标。然后系统会自动搜索能实现该目标的最佳提示词。

这会将提示词编写转变为一种编译产物。如果出现了一个新的、更便宜的模型,你无需恐慌。你只需针对新模型运行你的指标,然后重新生成提示词即可。

正如工程师从汇编语言转向编译器一样,AI 工程师必须从手动微调字符串转向优化指标。

不要再用“魔法词”去哄骗模型了。开始使用可衡量的规范进行构建吧。

Source: https://dev.to/raminjafary/the-rise-of-agentic-engineering-part-6-prompt-debt-the-limits-of-natural-language-28oi

Optional learning community: https://t.me/GyaanSetuAi