面向轻量级开源 LLM 的提示词驱动工具调用

像 GPT-4 这样的大型模型表现出色,但它们对计算资源的需求很高。

小型开源模型在处理复杂推理时往往表现不佳。运行大型模型需要大量的 GPU。

我研究了一种通过结构化提示词帮助小型模型使用工具的方法。这项研究题为 Prompt-Driven Tool-Calling for Lightweight Open Source LLMs。

问题所在:

  • 小型模型缺乏推理能力。
  • 运行大型模型成本高昂。
  • 我们需要能在较低硬件配置下运行的高效智能体 (agents)。

解决方案: 不要强迫模型记住所有内容。利用提示词将模型转变为一个控制器。

工作原理: 提示词引导模型:

  • 理解您的意图。
  • 将问题分解为步骤。
  • 选择工具而非盲目猜测。

工作流程遵循以下步骤: 用户问题 $\rightarrow$ LLM $\rightarrow$ 工具选择 $\rightarrow$ 工具执行 $\rightarrow$ 最终答案。

模型通过使用计算器等工具来确保事实的准确性。

核心优势:

  • 小型模型表现得像智能体。
  • AI 变得更加普及。
  • 智能取决于系统设计,而非模型规模。

我们应该扩展工具集成,而不仅仅是扩展参数规模。

这项工作发表于 AIS2C2 2025。

来源:https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

可选学习社区:https://t.me/GyaanSetuAi