Cos'è Loopcraft?

Il mondo dell'IA ha un nuovo termine: Loopcraft.

Alcuni potrebbero definirlo un nuovo nome per un vecchio concetto. Un tempo si parlava di Agent Loops o Workflow Engineering. Ma il cambiamento in atto nella Silicon Valley è reale.

Esperti come Andrej Karpathy e Boris Cherny si stanno allontanando dal prompting manuale. Non stanno più scrivendo prompt per gli agenti. Stanno progettando loop che scrivono prompt per gli agenti.

Il cambiamento fondamentale riguarda l'astrazione.

Vecchio modo: Umano -> Prompt -> Agente -> Risultato

Nuovo modo: Umano -> Progettazione del Loop -> Task Discovery -> Esecuzione -> Verifica Automatica -> Retry -> Salvataggio Stato -> Continua

Il Prompt Engineering ottimizza una singola interazione. Il Loopcraft ottimizza l'intero sistema che gira ripetutamente.

Il Loopcraft si concentra su domande sistemiche:

  • Chi avvia il task successivo?
  • Come fa l'agente a conoscere l'obiettivo?
  • Chi controlla l'output?
  • In che modo il fallimento genera feedback?
  • Come viene salvato lo stato tra una sessione e l'altra?

Se automatizzi solo un passaggio, non stai costruendo un sistema. Stai solo velocizzando un processo manuale.

Un vero loop gestisce l'intero ciclo di vita. Ad esempio, invece di correggere manualmente un fallimento della CI, un sistema Loopcraft:

  • Rileva il fallimento.
  • Legge i log.
  • Avvia un agente in un ambiente isolato.
  • Modifica il codice.
  • Esegue i test.
  • Utilizza un secondo verificatore per controllare la diff.
  • Crea una PR una volta superato il test.

Questa è la differenza tra un Agent Harness e il Loopcraft. Un Harness è l'ambiente. Fornisce strumenti, memoria e permessi. Risponde alla domanda: "Come lavora l'agente?" Il Loopcraft è l'orchestrazione. Risponde alla domanda: "Quando lavora l'agente e perché continua?"

Per costruire un loop minimo, servono sei parti:

  • Trigger: Un evento come un fallimento della CI o un job pianificato.
  • Goal: Una condizione o un test verificabile dalla macchina.
  • State: Un modo per memorizzare i progressi e i motivi del fallimento.
  • Worker: L'agente in esecuzione in un container isolato.
  • Verifier: Un test o un secondo LLM per valutare il lavoro.
  • Budget: Limiti di tempo, costi e tentativi di retry.

Il livello più alto di Loopcraft è il ciclo di miglioramento (improvement loop). Un semplice loop ripete il lavoro. Un ciclo di miglioramento analizza i fallimenti per cambiare il sistema stesso. Regola i prompt e gli strumenti in modo che l'esecuzione successiva sia migliore.

Smetti di cercare di correggere manualmente ogni singolo risultato. Inizia a correggere il sistema che produce quei risultati.

Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff

Optional learning community: https://t.me/GyaanSetuAi