Python 初学者生成式 AI 入门
大多数开发者使用固定规则编写代码。你接收输入,应用 if/else 语句或循环,然后返回一个可预测的结果。这对于 JSON 或 CSV 等结构化数据非常有效。
但面对杂乱的任务时该怎么办呢?
- 总结 100 张支持工单。
- 将功能列表转换为电子邮件。
- 对比博客文章中的优缺点。
你可以使用正则表达式 (regex) 或复杂的模板,但这种方式很脆弱。生成式 AI 可以轻松处理这类模糊的任务。
工作原理
生成式模型遵循一个简单的循环:
- 它查看你的提示词 (prompt) 和之前的文本。
- 它预测下一小段文本。
- 它将该片段添加到文本中。
- 它重复此过程,直到任务完成。
大语言模型 (LLMs) 使用一种称为 transformer 的架构。模型不是从左到右阅读,而是同时查看输入的所有部分。它会决定哪些词对下一次预测最为重要。
对于 Python 开发者来说,有两件事非常重要:tokens 和上下文窗口 (context windows)。
Tokens
模型不会直接读取原始字符串。它们将文本分解为 tokens。一个 token 是单词的一个小片段。API 的计费和限制使用的是 tokens 而不是字符数。
上下文窗口 (Context Window)
这是模型一次能看到的文本量。它包括你的提示词、聊天历史和模型输出。如果你超过了这个限制,模型就会忘记对话中最久远的部分。
从提示词转向智能体 (Agents)
向模型发送单个提示词只是一个开始。你可以总结文本或解释错误。然而,基础的 LLM 是有局限性的:
- 它无法调用你的数据库或 API。
- 它无法在请求之间记住信息。
- 它可能会编造事实。
要构建真正的产品,你需要智能体 (agents)。智能体为 LLM 增加了三样东西:
- 工具 (Tools):如网页搜索或计算器等函数。
- 记忆 (Memory):用于存储过去的对话和用户数据的存储空间。
- 编排 (Orchestration):决定使用哪个工具以及何时停止的逻辑。
普通的 LLM 只给出一个答案。而智能体则接收一个目标,并利用工具和记忆来达成可靠的结果。
可选学习社区:https://t.me/GyaanSetuAi