AIエージェントへの「質問」と「委任」の違い

ほとんどの開発者は、AIをStack Overflowのより賢いバージョンとして利用しています。

質問を入力し、回答を得る。そして、作業自体は自分で行う。この方法は時間がかかります。

もっと速い方法があります。「質問」するのをやめ、「委任」し始める必要があるのです。

AIにこう「質問」する場合: 「認証モジュールのテストをどう書けばいいですか?」 説明は得られますが、テストを書くのは依然としてあなた自身です。作業もあなた自身が行います。

AIエージェントに「委任」する場合: 「/src/auth.py のテストを書いてください。ログイン、ログアウト、および無効なトークンのケースをカバーしてください。テストを実行し、失敗した場合はパスするまでコードを修正してください。何を変更したか報告してください。」

エージェントはファイルを開き、テストを書き、実行します。失敗内容を読み取り、コードを修正します。そして、動作するテストスイートを届けてくれます。

あなたは結果をレビューするだけです。作業自体は行っていません。

効果的な委任には、4つの要素が必要です:

  • ゴール:エージェントは何を成果物として出すべきか?
  • スコープ:どのファイルや領域に手を付けるべきか?
  • 成功条件:正しく完了したことをどう判断するか?
  • レポート:何を、なぜ変更したのか?

実践的な例:

デバッグ: 「このエラーとスタックトレースの根本原因を特定してください。修正し、何が壊れていたのか説明してください。」

リファクタリング: 「このファイルをリファクタリングしてください。ネストは最大2レベルまで。関数の長さは30行以内。すべての呼び出し箇所を更新してください。」

データベース移行: 「このスキーマ変更に対して、冪等(べきとう)なマイグレーションスクリプトを書いてください。ローカルデータベースで実行し、成功することを確認してください。」

レビュー: 「このPRの差分(diff)を読んでください。本番環境で失敗する可能性があるものを探し、私が書き漏らしたテストを書いてください。」

エージェントは高速ですが、時には間違えることもあります。彼らの成果を検証するために、以下の3つのチェックを行ってください:

  1. 問題は解決したか? コードを読むだけでなく、実行してください。テストを実行しましょう。コードを動かすことこそが、エッジケースの失敗を見つける唯一の方法です。

  2. コードベースに適合しているか? エージェントはチームの規約を知りません。出力の中に、不自然なパターンやチームが避けているライブラリが含まれていないか確認してください。

  3. スコープ外の変更をしていないか? エージェントがどのファイルに触れたかを確認してください。ジュニア開発者からのPRを読むように差分を確認しましょう。役に立とうとするあまり、他の部分を壊していないか確かめてください。

あなたの役割は、作業を行うことから、ゴールを定義し結果をレビューすることへと変わります。あなたが判断を下し、エージェントがスピードを提供します。

Source: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii

Optional learning community: https://t.me/GyaanSetuAi