エージェンティック・ワークフローの4つの設計次元

AIエージェントとAIワークフローを混同してしまうことがよくあります。ツールを備えたLLMであれば何でもエージェントだと言う人もいれば、エージェントは長時間自律的に動作しなければならないと言う人もいます。こうした議論は、より良いシステムを構築する上では役に立ちません。

システムが「エージェンティック(エージェント的)」かどうかを問うのはやめましょう。代わりに、以下の4つの設計次元に注目してください。

  1. 次のステップを誰が決めるのか?
  • コード駆動型 (Code-driven): コードがシーケンスを制御します。明確なルールがある、リスクの高いタスクに適しています。
  • モデル駆動型 (Model-driven): LLMがステップを計画します。自由度の高いタスクに適しています。
  • ハイブリッド型 (Hybrid): コードが枠組みを設定し、LLMが細かな意思決定を行います。これが最も実用的な選択肢です。
  1. パス(経路)は固定されているか?
  • 固定型 (Fixed): ステップが決まった順序に従います。
  • 条件付き型 (Conditional): 結果に基づいて、システムが分岐やリトライを行います。
  • 適応型 (Adaptive): 実行時にパスが変化します。リサーチやデバッグに適しています。
  1. エージェント同士はどう連携するか?
  • シングルエージェント (Single Agent): 1つのエージェントが複数のツールを使用します。シンプルですが、コンテキストが混乱しやすくなります。
  • マネージャー・ワーカー型 (Manager-Worker): 1つのエージェントがタスクを分解し、他のエージェントに割り当てます。
  • ハンドオフ型 (Handoff): 1つのエージェントが制御をスペシャリスト(専門エージェント)に渡します。
  • ピア型 (Peer): 中央のリーダーなしに複数のエージェントが協力します。デバッグが最も困難な形式です。
  1. 人間はどこで介入するか?
  • 人間によるトリガー型 (Human-triggered): 主要なアクションごとに承認を行います。
  • チェックポイント型 (Checkpointed): システムは自律的に動作しますが、リスクの高いステップで承認のために停止します。
  • ガードレール付きゴール駆動型 (Goal-driven with guardrails): ゴールを設定すると、システムは予算や権限などの制限内で動作します。

単に見栄を張るためにエージェントを追加してはいけません。エージェントを追加すると、レイテンシ、コスト、デバッグの難易度が増大します。複数のエージェントを使用するのは、タスクを並列実行できる場合や、単一のエージェントではコンテキストが多すぎる場合に限ってください。

アーキテクチャをタスクに合わせましょう。タスクにリスクがある場合はチェックポイントを使用してください。タスクが単純な場合はコードを使用してください。

構築する前に、次の6つの質問を自問してください:

  • 通常のコードで解決できるか?
  • 入力のバリエーションはどの程度か?
  • タスクを分割できるか?
  • 失敗した場合のコストはどのくらいか?
  • どこで壊れたかを確認できるか?
  • 追加の複雑さは、その結果に見合うものか?

優れたワークフローとは、柔軟であるべきところは柔軟であり、予測可能であるべきところは予測可能であるものです。

Source: https://dev.to/whchi/4-design-dimensions-of-agentic-workflows-1i0m

Optional learning community: https://t.me/GyaanSetuAi