AIチャットボックスからの脱却

ほとんどのAIデモはどれも同じに見えます。チャットウィンドウが表示され、プロンプトを入力し、テキストが流れてくるのを眺める。このインターフェースは罠です。解決策を構築するのではなく、質問をすることに慣れさせてしまうからです。

バークレー校のCS(コンピュータサイエンス)の学生たちは、より良い方法を見つけました。彼らはアルゴリズムの宿題にチャットボックスを使うのをやめ、代わりに自律型エージェントを構築したのです。これらのエージェントはチャットをしません。計画を立て、コードを実行し、結果をメールで送信します。

システムの仕組み:

• タスクプランナー:軽量なLLMが、目標をサブタスクのJSONリストに変換します。各タスクには明確な成功ルールが設定されています。 • コードエグゼキューター:別のLLMが各タスク用のPythonスクリプトを記述します。これらのスクリプトはDockerサンドボックス内で実行されるため、コンピュータの安全性は保たれます。コードが失敗した場合、エージェントはエラーメッセージを用いて再試行します。 • SQLiteストア:これはエージェントのメモリです。膨大なチャット履歴を使用する代わりに、エージェントはローカルデータベースに対してデータの読み書きを行います。これにより、コストを低く抑え、エラーを防ぐことができます。 • メールアグリゲーター:エージェントの作業を監視する必要はありません。ジョブが完了すると、エージェントは結果と使用されたコードを含む完全なレポートをメールで送信します。

なぜこれがChatGPTより優れているのか:

  • コスト:OpenRouter経由で小型モデルを使用すれば、費用はドル単位ではなくセント単位で済みます。
  • メモリ:コンテキストウィンドウの代わりにデータベースを使用することで、エージェントが混乱するのを防ぎます。
  • 信頼性:エージェントはコードを使用して結果を検証します。単なるテキストではなく、数学的・論理的な結果が得られます。
  • セキュリティ:サンドボックスにより、エージェントが個人のファイルに触れることはできません。

このアーキテクチャは、データ分析、ファイル処理、数学に適しています。一方で、クリエイティブなライティングや主観的なタスクには向きません。それらには依然として人間が必要です。

単純作業にチャットを使うのはやめましょう。あなたが眠っている間に働いてくれるエージェントを構築しましょう。

Source: https://dev.to/youngones/breaking-the-ai-chatbox-how-berkeley-students-built-real-autonomous-agents-270c

Optional learning community: https://t.me/GyaanSetuAi