Python 初学者生成式 AI 入门

Machine-translated. Read the original.

📅3 hours ago⏱2 min read

In this article

大多数开发者使用固定规则编写代码。你接收输入，应用 if/else 语句或循环，然后返回一个可预测的结果。这对于 JSON 或 CSV 等结构化数据非常有效。

但面对杂乱的任务时该怎么办呢？

你可以使用正则表达式 (regex) 或复杂的模板，但这种方式很脆弱。生成式 AI 可以轻松处理这类模糊的任务。

工作原理

生成式模型遵循一个简单的循环：

大语言模型 (LLMs) 使用一种称为 transformer 的架构。模型不是从左到右阅读，而是同时查看输入的所有部分。它会决定哪些词对下一次预测最为重要。

对于 Python 开发者来说，有两件事非常重要：tokens 和上下文窗口 (context windows)。

模型不会直接读取原始字符串。它们将文本分解为 tokens。一个 token 是单词的一个小片段。API 的计费和限制使用的是 tokens 而不是字符数。

这是模型一次能看到的文本量。它包括你的提示词、聊天历史和模型输出。如果你超过了这个限制，模型就会忘记对话中最久远的部分。

向模型发送单个提示词只是一个开始。你可以总结文本或解释错误。然而，基础的 LLM 是有局限性的：

要构建真正的产品，你需要智能体 (agents)。智能体为 LLM 增加了三样东西：

普通的 LLM 只给出一个答案。而智能体则接收一个目标，并利用工具和记忆来达成可靠的结果。