La parte difficile degli agenti AI non è l'esecuzione, è la pianificazione

Costruire un agente AI che esegue compiti è facile. Costruirne uno che li pianifichi correttamente è difficile.

Ho creato una CLI in cui digiti una frase e un LLM esegue azioni sui tuoi account reali. Utilizzo due modalità: Direct mode e Plan mode.

Direct mode serve per la velocità. Plan mode serve per la sicurezza. In Plan mode, l'agente ti mostra ogni passaggio prima di toccare i tuoi dati.

Ecco come ho costruito un pianificatore affidabile:

• Dividi il cervello Un singolo agente non può occuparsi sia della pianificazione che dell'esecuzione. Un agente di pianificazione vuole pensare. Un agente di esecuzione vuole agire. Li ho separati in due agenti diversi con due diversi system prompt. Questo evita che entrino in conflitto tra loro.

• Dai degli occhi all'agente Un pianificatore che va a intuito è pericoloso. La mia prima versione creava piani basati su supposizioni. Ora, il pianificatore utilizza strumenti di sola lettura per analizzare prima i tuoi dati. Esamina i tuoi campi Salesforce reali prima di scrivere anche un solo passaggio.

• Precompila le risposte Gli agenti spesso pongono domande sbagliate. Se ne pongono troppe, finisci per fare il lavoro al posto loro. Ho cambiato approccio. Il pianificatore pone comunque delle domande, ma fornisce una risposta consigliata. Devi solo confermare o suggerire una modifica. Questo mantiene il piano accurato senza dover inserire i dati manualmente.

• Passa il contesto, non solo l'elenco Se fornisci a un esecutore solo un elenco di passaggi, perde il filo del ragionamento. Ho fatto in modo che il pianificatore passi anche le supposizioni e i rischi insieme ai passaggi. L'esecutore ora conosce il "perché" dietro ogni azione.

• Etichetta il pericolo Un piano è sicuro solo se puoi vedere i rischi. Il mio sistema segnala le azioni distruttive, come l'eliminazione o la rinomina. Quando l'agente incontra un passaggio distruttivo, si ferma e ti chiede conferma.

• Usa i dati come arbitro Se un agente pensa che un passaggio sia fallito e tu gli dici di riprovare, non obbedisce ciecamente. Controlla i dati reali della piattaforma. Se i dati mostrano che il compito è già stato completato, l'agente si fida dei dati piuttosto che della tua indicazione.

La verità sulla sicurezza: Plan mode non ferma il prompt injection o un utente che clicca su "approve" senza guardare. Sposta la responsabilità dal "fidarsi del modello" al "fidarsi dell'essere umano che revisiona".

La struttura fornisce i guardrail, ma la tua revisione garantisce la sicurezza finale.

Source: https://dev.to/abdullahsaad5/the-hard-part-of-my-ai-agent-wasnt-doing-the-work-it-was-planning-it-n0k

Optional learning community: https://t.me/GyaanSetuAi