Chamada de Ferramentas Orientada por Prompts para LLMs de Código Aberto Leves

Modelos grandes como o GPT-4 funcionam bem. Eles possuem altas necessidades de computação.

Modelos pequenos de código aberto frequentemente têm dificuldade com raciocínios complexos. Você precisa de GPUs massivas para rodar modelos grandes.

Eu pesquisei uma maneira de ajudar modelos pequenos a usar ferramentas por meio de prompts estruturados. Esta pesquisa é intitulada Prompt-Driven Tool-Calling for Lightweight Open Source LLMs.

O Problema:

  • Modelos pequenos carecem de habilidades de raciocínio.
  • Rodar modelos grandes é caro.
  • Precisamos de agentes eficientes que rodem em menos hardware.

A Solução: Pare de forçar os modelos a memorizarem tudo. Use prompts para transformar o modelo em um controlador.

Como funciona: O prompt guia o modelo para:

  • Entender sua intenção.
  • Dividir problemas em etapas.
  • Selecionar uma ferramenta em vez de apenas adivinhar.

O fluxo de trabalho segue estas etapas: Pergunta do Usuário $\rightarrow$ LLM $\rightarrow$ Seleção de Ferramenta $\rightarrow$ Execução da Ferramenta $\rightarrow$ Resposta Final.

O modelo utiliza ferramentas como uma calculadora para obter fatos com precisão.

Principais Benefícios:

  • Modelos pequenos agem como agentes inteligentes.
  • A IA torna-se mais acessível.
  • A inteligência depende do design do sistema, e não do tamanho do modelo.

Devemos escalar a integração de ferramentas em vez de apenas escalar parâmetros.

Este trabalho foi publicado na AIS2C2 2025.

Fonte: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi