Loopcraftとは何か?
AIの世界に新しい用語が登場しました。それが「Loopcraft」です。
古い概念に新しい名前をつけただけだと言う人もいるかもしれません。かつては「エージェント・ループ(Agent Loops)」や「ワークフロー・エンジニアリング(Workflow Engineering)」と呼ばれていました。しかし、シリコンバレーで起きている変化は本物です。
Andrej KarpathyやBoris Chernyのような専門家は、手動のプロンプティングから脱却しつつあります。彼らはもはやエージェントにプロンプトを送るのではなく、エージェントにプロンプトを送るための「ループ」を設計しているのです。
本質的な変化は「抽象化」にあります。
旧来の手法: 人間 -> プロンプト -> エージェント -> 結果
新しい手法: 人間 -> ループの設計 -> タスクの発見 -> 実行 -> 自動検証 -> 再試行 -> 状態の保存 -> 継続
プロンプト・エンジニアリングは単一のやり取りを最適化しますが、Loopcraftは繰り返し実行されるシステム全体を最適化します。
Loopcraftは、以下のようなシステム的な問いに焦点を当てます:
- 次のタスクを開始するのは誰か?
- エージェントはどうやってゴールを認識するのか?
- 出力を誰がチェックするのか?
- 失敗をどのようにフィードバックに繋げるか?
- セッション間でどのように状態を保存するか?
もし一つのステップを自動化するだけなら、それはシステムを構築していることにはなりません。単に手作業のプロセスを高速化しているに過ぎないのです。
真のループは、ライフサイクル全体を扱います。例えば、CIの失敗を手動で修正する代わりに、Loopcraftシステムは以下のように動きます:
- 失敗を検知する。
- ログを読み取る。
- 隔離された環境でエージェントを起動する。
- コードを修正する。
- テストを実行する。
- 2つ目の検証者(verifier)を使用して差分(diff)をチェックする。
- パスしたらPRを作成する。
これが「エージェント・ハーネス(Agent Harness)」と「Loopcraft」の違いです。 ハーネスは「環境」です。ツール、メモリ、権限を提供し、「エージェントをどのように動作させるか?」という問いに答えます。 Loopcraftは「オーケストレーション」です。「エージェントをいつ実行し、なぜ継続させるのか?」という問いに答えます。
最小限のループを構築するには、6つの要素が必要です:
- トリガー(Trigger):CIの失敗やスケジュールされたジョブなどのイベント。
- ゴール(Goal):機械的に検証可能な条件またはテスト。
- 状態(State):進捗や失敗の理由を保存する方法。
- ワーカー(Worker):隔離されたコンテナ内で実行されるエージェント。
- 検証者(Verifier):作業を評価するためのテスト、または2つ目のLLM。
- バジェット(Budget):時間、コスト、再試行回数の制限。
Loopcraftの最高レベルは「改善ループ(improvement loop)」です。単純なループは作業を繰り返すだけですが、改善ループは失敗を分析してシステム自体を変更します。プロンプトやツールを調整することで、次回の実行をより良いものにします。
一つひとつの結果を手動で修正しようとするのはやめましょう。その結果を生み出している「システム」を修正し始めるのです。
Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff
Optional learning community: https://t.me/GyaanSetuAi
