AIエージェントへの「質問」と「委任」の違い
ほとんどの開発者は、AIをStack Overflowのより賢いバージョンとして利用しています。
質問を入力し、回答を得る。そして、作業自体は自分で行う。この方法は時間がかかります。
もっと速い方法があります。「質問」するのをやめ、「委任」し始める必要があるのです。
AIにこう「質問」する場合: 「認証モジュールのテストをどう書けばいいですか?」 説明は得られますが、テストを書くのは依然としてあなた自身です。作業もあなた自身が行います。
AIエージェントに「委任」する場合:
「/src/auth.py のテストを書いてください。ログイン、ログアウト、および無効なトークンのケースをカバーしてください。テストを実行し、失敗した場合はパスするまでコードを修正してください。何を変更したか報告してください。」
エージェントはファイルを開き、テストを書き、実行します。失敗内容を読み取り、コードを修正します。そして、動作するテストスイートを届けてくれます。
あなたは結果をレビューするだけです。作業自体は行っていません。
効果的な委任には、4つの要素が必要です:
- ゴール:エージェントは何を成果物として出すべきか?
- スコープ:どのファイルや領域に手を付けるべきか?
- 成功条件:正しく完了したことをどう判断するか?
- レポート:何を、なぜ変更したのか?
実践的な例:
デバッグ: 「このエラーとスタックトレースの根本原因を特定してください。修正し、何が壊れていたのか説明してください。」
リファクタリング: 「このファイルをリファクタリングしてください。ネストは最大2レベルまで。関数の長さは30行以内。すべての呼び出し箇所を更新してください。」
データベース移行: 「このスキーマ変更に対して、冪等(べきとう)なマイグレーションスクリプトを書いてください。ローカルデータベースで実行し、成功することを確認してください。」
レビュー: 「このPRの差分(diff)を読んでください。本番環境で失敗する可能性があるものを探し、私が書き漏らしたテストを書いてください。」
エージェントは高速ですが、時には間違えることもあります。彼らの成果を検証するために、以下の3つのチェックを行ってください:
問題は解決したか? コードを読むだけでなく、実行してください。テストを実行しましょう。コードを動かすことこそが、エッジケースの失敗を見つける唯一の方法です。
コードベースに適合しているか? エージェントはチームの規約を知りません。出力の中に、不自然なパターンやチームが避けているライブラリが含まれていないか確認してください。
スコープ外の変更をしていないか? エージェントがどのファイルに触れたかを確認してください。ジュニア開発者からのPRを読むように差分を確認しましょう。役に立とうとするあまり、他の部分を壊していないか確かめてください。
あなたの役割は、作業を行うことから、ゴールを定義し結果をレビューすることへと変わります。あなたが判断を下し、エージェントがスピードを提供します。
Source: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii
Optional learning community: https://t.me/GyaanSetuAi
