在自动化工作流中隔离 LLM 邮件

Translated for your language. 阅读原文.

AI-assisted draft.

GyaanSetu Editorial14小时前2分钟阅读

当 LLM 智能体（agent）开始发送邮件或审批工单时，问题性质就发生了变化。这不再仅仅关乎你的提示词（prompt）是否有效，而是你的系统现在依赖于三个层面：决策、执行和验证。

如果你将这些层面混为一谈，你的团队将很难理解智能体究竟做了什么。

邮件步骤通常看起来像是工作流的终点。但实际上，它正是故障最先显现的地方。智能体可能会正确地对请求进行分类，但却将其发送给了错误的人，或者使用了过期的链接。你必须隔离测试和追踪（traces）。

一个稳定的设计不会试图一次性测试智能。相反，你应该将系统划分为小的契约（contracts）：

不要将邮件逻辑放在自由提示词中。LLM 可以建议一个操作，例如 "send_followup_email"。然而，模型不应决定邮件头、收件人或重试策略。应使用确定性代码（deterministic code）来处理这些转换。

这种方法降低了运维风险。LLM 提出建议，系统进行验证，执行器负责发送。

为了保持清晰的可视化，请追踪以下四个信号：

从初始事件到最终点击，使用共享的 trace_id。这有助于你快速定位错误。你会知道故障是发生在模型、工具策略还是执行器（worker）中。

请遵循以下清单以实现更好的自动化：

分离这些步骤会增加一些工作量。但它能带给你非常有价值的东西：解释为什么发送了邮件或为什么邮件发送失败的能力。

Optional learning community: https://t.me/GyaanSetuAi

继续阅读