La partie difficile des agents IA n'est pas l'exécution, c'est la planification

Construire un agent IA qui exécute des tâches est facile. En construire un qui les planifie correctement est difficile.

J'ai conçu une interface en ligne de commande (CLI) où vous tapez une phrase et un LLM exécute des actions sur vos comptes réels. J'utilise deux modes : le mode Direct et le mode Plan.

Le mode Direct privilégie la rapidité. Le mode Plan privilégie la sécurité. En mode Plan, l'agent vous montre chaque étape avant de toucher à vos données.

Voici comment j'ai construit un planificateur fiable :

• Diviser le cerveau Un seul agent ne peut pas gérer à la fois la planification et l'exécution. Un agent de planification veut réfléchir. Un agent d'exécution veut agir. Je les ai séparés en deux agents distincts avec deux prompts système différents. Cela évite qu'ils ne s'affrontent.

• Donner des yeux à l'agent Un planificateur qui devine est dangereux. Ma première version inventait des plans basés sur des suppositions. Désormais, le planificateur utilise des outils en lecture seule pour analyser vos données au préalable. Il examine vos champs Salesforce réels avant d'écrire la moindre étape.

• Pré-remplir les réponses Les agents posent souvent de mauvaises questions. S'ils en posent trop, vous finissez par faire le travail à leur place. J'ai changé cela. Le planificateur pose toujours des questions, mais il propose une réponse recommandée. Vous n'avez plus qu'à confirmer ou à l'ajuster légèrement. Cela permet de maintenir la précision du plan sans saisie manuelle de données.

• Transmettre le contexte, pas seulement la liste Si vous ne donnez à un exécutant qu'une liste d'étapes, il perd le raisonnement. J'ai fait en sorte que le planificateur transmette les hypothèses et les risques en même temps que les étapes. L'exécutant connaît désormais le « pourquoi » de chaque action.

• Signaler le danger Un plan n'est sûr que si vous pouvez en voir les risques. Mon système marque les actions destructives comme la suppression ou le renommage. Lorsque l'agent atteint une étape destructive, il s'arrête et vous sollicite.

• Utiliser les données comme arbitre Si un agent pense qu'une étape a échoué et que vous lui demandez de réessayer, il ne se contente pas d'obéir aveuglément. Il vérifie les données réelles de la plateforme. Si les données indiquent que la tâche est déjà terminée, l'agent fait confiance aux données plutôt qu'à votre instruction.

La vérité sur la sécurité : Le mode Plan n'empêche pas l'injection de prompt (prompt injection) ni un utilisateur qui clique sur « approuver » sans regarder. Il déplace la responsabilité de « faire confiance au modèle » vers « faire confiance à l'humain pour la révision ».

La structure fournit les garde-fous, mais votre révision assure la sécurité finale.

Source: https://dev.to/abdullahsaad5/the-hard-part-of-my-ai-agent-wasnt-doing-the-work-it-was-planning-it-n0k

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi