La regola dell'80/20 del codice AI

L'AI ha scritto l'80% della mia funzionalità in 10 minuti. Il codice sembrava pulito. La logica aveva senso. Ha funzionato al primo colpo. Mi sono sentito fantastico.

Ma l'AI è utile per il primo 80% e inutile per l'ultimo 20%.

L'AI ottimizza per l'happy path. Costruisce per un mondo in cui tutto va per il verso giusto. Il software reale vive in un mondo in cui le cose vanno male.

Recentemente ho costruito un Sol Email Worker. L'AI ha generato la logica principale, il threading e il routing in 20 minuti. Quella è stata la parte facile.

L'ultimo 20% ha richiesto la mia vera competenza:

• Deduplicazione: Gestione dei messaggi duplicati. • Logica di skip del mittente: Evitare l'elaborazione dei propri messaggi. • Recupero degli errori: Gestione di risposte API inaspettate. • Output dei log: Rendere possibile il debugging alle 2 del mattino.

L'AI ha fatto ciò che le ho chiesto. Non ho pensato a chiedere i casi limite perché non ci avevo ancora riflettuto a fondo.

Abbiamo un problema di misurazione. Monitoriamo le righe di codice e i ticket chiusi. Queste metriche premiano il rapido 80%. Nessuno monitora il tempo speso nella gestione degli errori o nei controlli null.

Il 20% è invisibile su una dashboard, ma è lì che avviene il vero lavoro. Ora monitoro il prompt-to-ship time. Si tratta del tempo che intercorre dal primo prompt a una funzionalità di produzione stabile. Questo numero è sempre almeno 4 volte superiore al tempo di generazione dell'AI.

Ecco come lavoro ora:

  • Prevedo un tempo pari a 4 volte quello dell'AI per ogni task.
  • Scrivo prompt per l'unhappy path. Dico all'AI di assumere che la rete fallisca o che l'API restituisca null.
  • Considero la prima bozza come un punto di partenza, non come un traguardo.

Le 3 ore che ho passato sulla gestione degli errori dopo 30 secondi di generazione non sono state sprecate. Era il vero lavoro. L'AI ha spostato il lavoro dalla scrittura della struttura al rendere il codice reale.

Rendere il codice reale è un processo lento. Richiede il tuo contesto specifico, i tuoi utenti e la cronologia del tuo codebase. È questo che significa competenza.

L'AI lavora in territori familiari. I casi limite sono territori sconosciuti ogni volta.

La prossima volta che una demo di AI ti impressiona, chiediti cosa è successo dopo la fine della demo.

Fonte: https://dev.to/amrree/the-8020-rule-of-ai-code-id

Community di apprendimento opzionale: https://t.me/GyaanSetuAi