面向轻量级开源 LLM 的提示词驱动工具调用
像 GPT-4 这样的大型模型表现出色,但它们对计算资源的需求很高。
小型开源模型在处理复杂推理时往往表现不佳。运行大型模型需要大量的 GPU。
我研究了一种通过结构化提示词帮助小型模型使用工具的方法。这项研究题为 Prompt-Driven Tool-Calling for Lightweight Open Source LLMs。
问题所在:
- 小型模型缺乏推理能力。
- 运行大型模型成本高昂。
- 我们需要能在较低硬件配置下运行的高效智能体 (agents)。
解决方案: 不要强迫模型记住所有内容。利用提示词将模型转变为一个控制器。
工作原理: 提示词引导模型:
- 理解您的意图。
- 将问题分解为步骤。
- 选择工具而非盲目猜测。
工作流程遵循以下步骤: 用户问题 $\rightarrow$ LLM $\rightarrow$ 工具选择 $\rightarrow$ 工具执行 $\rightarrow$ 最终答案。
模型通过使用计算器等工具来确保事实的准确性。
核心优势:
- 小型模型表现得像智能体。
- AI 变得更加普及。
- 智能取决于系统设计,而非模型规模。
我们应该扩展工具集成,而不仅仅是扩展参数规模。
这项工作发表于 AIS2C2 2025。
来源:https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf
可选学习社区:https://t.me/GyaanSetuAi