Asking vs Delegating AI Agents

La maggior parte degli sviluppatori usa l'IA come una versione più intelligente di Stack Overflow.

Scrivi una domanda. Ottieni una risposta. Poi fai il lavoro da solo. Questo metodo è lento.

C'è un modo più veloce. Devi smettere di chiedere e iniziare a delegare.

Quando chiedi a un'IA: "Come scrivo i test per il mio modulo di autenticazione?" Ottieni una spiegazione. Scrivi comunque i test. Fai comunque il lavoro.

Quando deleghi a un agente IA: "Scrivi i test per /src/auth.py. Copri i casi di login, logout e token non validi. Eseguili. Se falliscono, correggi il codice finché non passano. Dimmi cosa hai cambiato."

L'agente apre i tuoi file. Scrive i test. Li esegue. Legge gli errori. Corregge il codice. Ti consegna una suite di test funzionante.

Tu revisioni il risultato. Non hai fatto il lavoro.

Una delega efficace richiede quattro parti:

  • Obiettivo: Cosa dovrebbe produrre l'agente?
  • Ambito: Quali file o aree deve toccare?
  • Condizione di successo: Come facciamo a sapere che è stato fatto correttamente?
  • Report: Cosa ha cambiato e perché?

Esempi pratici:

Debugging: "Trova la causa principale di questo errore e lo stack trace. Correggilo e spiega l'interruzione."

Refactoring: "Rifattorizza questo file. Usa un massimo di due livelli di annidamento. Nessuna funzione più lunga di 30 righe. Aggiorna ogni punto di chiamata."

Migrazione del database: "Scrivi uno script di migrazione idempotente per questo cambiamento di schema. Eseguilo su un database locale per confermare che vada a buon fine."

Revisione: "Leggi la diff di questa PR. Trova qualsiasi cosa che potrebbe fallire in produzione. Scrivi i test che ho tralasciato."

Gli agenti sono veloci. A volte sbagliano anche. Usa questi tre controlli per verificare il loro lavoro:

  1. Ha risolto il problema? Esegui il codice. Non limitarti a leggerlo. Esegui i test. Far girare il codice è l'unico modo per trovare fallimenti in casi limite.

  2. Si adatta al tuo codebase? L'agente non conosce le convenzioni del tuo team. Scansiona l'output alla ricerca di pattern insoliti o librerie che il tuo team evita.

  3. Ha cambiato cose al di fuori dell'ambito? Controlla quali file ha toccato l'agente. Leggi la diff come se fosse una PR di un developer junior. Assicurati che non abbia rotto nulla mentre cercava di essere utile.

Il tuo lavoro passa dal fare il lavoro al definire l'obiettivo e revisionare il risultato. Tu fornisci il giudizio. L'agente fornisce la velocità.

Source: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii

Optional learning community: https://t.me/GyaanSetuAi