𝗔𝗽𝗽𝗲𝗹 𝗱'𝗼𝘂𝘁𝗶𝗹𝘀 𝗽𝗶𝗹𝗼𝘁é 𝗽𝗮𝗿 𝗹𝗲 𝗽𝗿𝗼𝗺𝗽𝘁 𝗽𝗼𝘂𝗿 𝗹𝗲𝘀 𝗟𝗟𝗠 𝗼𝗽𝗲𝗻 𝘀𝗼𝘂𝗿𝗰𝗲 𝗹é𝗴𝗲𝗿𝘀

Les grands modèles comme GPT-4 fonctionnent bien. Ils nécessitent une puissance de calcul élevée.

Les petits modèles open source ont souvent du mal avec le raisonnement complexe. Il faut des GPU massifs pour faire tourner les grands modèles.

J'ai effectué des recherches pour aider les petits modèles à utiliser des outils via des prompts structurés. Cette recherche s'intitule Prompt-Driven Tool-Calling for Lightweight Open Source LLMs.

Le problème :

  • Les petits modèles manquent de capacités de raisonnement.
  • Faire tourner de grands modèles est coûteux.
  • Nous avons besoin d'agents efficaces qui fonctionnent sur du matériel moins puissant.

La solution : Arrêtez de forcer les modèles à tout mémoriser. Utilisez des prompts pour transformer le modèle en contrôleur.

Comment ça marche : Le prompt guide le modèle pour :

  • Comprendre votre intention.
  • Décomposer les problèmes en étapes.
  • Sélectionner un outil plutôt que de deviner.

Le flux de travail suit ces étapes : Question de l'utilisateur $\rightarrow$ LLM $\rightarrow$ Sélection de l'outil $\rightarrow$ Exécution de l'outil $\rightarrow$ Réponse finale.

Le modèle utilise des outils comme une calculatrice pour garantir l'exactitude des faits.

Avantages clés :

  • Les petits modèles agissent comme des agents intelligents.
  • L'IA devient plus accessible.
  • L'intelligence dépend de la conception du système plutôt que de la taille du modèle.

Nous devrions privilégier l'intégration d'outils plutôt que de simplement augmenter le nombre de paramètres.

Ce travail est publié dans AIS2C2 2025.

Source : https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi