OpenAI Codex、複雑なワークフローを自動化する「Record & Replay」を発表

OpenAIは、macOS版Codexアプリに革新的な「Record & Replay」機能を導入しました。これは、自律型エージェントの能力における大きな飛躍を意味します。ユーザーによる一連の手動操作を観察することで、AIは人間の動作を永続的で再利用可能なデジタルスキルへと変換できるようになります。

観察から自動化へ:Record & Replayの仕組み

最新のCodexアップデートにおける核心的なイノベーションは、単発のセッションによるワークフローを、繰り返しの可能な自動化へと変換できる点にあります。プロセスを説明するために複雑なスクリプトやプロンプトを書く代わりに、ユーザーはAIエージェントに特定のタスクを「実演(walk)」して見せるだけで済みます。例えば、メタデータの添付、サムネイルの選択、字幕のアップロードといった、YouTube動画のアップロードプロセス全体をデモンストレーションすることが可能です。

デモンストレーションが完了すると、Codexはこれらのアクションを「スキル」としてエンコードします。これにより、エージェントは将来的にこの一連のシーケンスを自律的に実行できるようになります。これは、AIとのやり取りを単純なチャットベースの指示から、モデルが人間と同じようにオペレーティングシステムやアプリケーションのインターフェースを操作する真の「Computer Use」へと進化させるものです。

技術的な強化とバージョン 26.616 のアップデート

Record & Replay機能に加え、バージョン 26.616 では、プロフェッショナルなパワーユーザーや開発者向けに設計された重要なインフラストラクチャのアップデートが導入されています。Automations履歴に新しい一括操作が追加され、以前に記録したタスクの管理が容易になったほか、高度な「ハンドオフ(hand-off)」機能も実装されました。これにより、ローカルマシンとリモートホスト間でアクティブなスレッドを転送できるようになり、接続されたハードウェア上で複雑なタスクをシームレスに継続することが可能になります。

これらの高度な自動化機能を利用するには、「Computer Use」が有効になっている必要があります。Codexのダウンロードは無料ですが、これらのワークフローを実行するために必要な高度な推論には、有料のChatGPTアカウントが必要です。

地域的な利用可能性とAIを取り巻く広範な状況

これらの機能の展開には、地理的な制約があります。現在、Record & Replayはイギリス、スイス、およびEUでは利用できません。しかし、基盤となる「Computer Use」機能は6月16日からEUで利用可能となっており、将来的な機能の均一化に向けた準備が整っています。

この進展は、AI業界にとって極めて重要な転換点となります。私たちは、LLMが単なる「知識エンジン」から「アクションエンジン」へと進化する過程を目の当たりにしています。GUIベースのタスクを観察し、再現する能力を習得することで、CodexはOpenAIをホワイトカラー業務自動化の分野で主導的な地位に就かせようとしています。これにより、デスクトップOSは手動のクリックではなく、インテリジェントなエージェントによって制御される環境へと実質的に変貌を遂げることになります。

主なポイント

  • 行動の模倣: 新しい Record & Replay 機能により、Codexは一度の手動デモンストレーションを、再利用可能な自動化スキルへと変換できるようになります。
  • 高度なワークフロー管理: バージョン 26.616 では、ローカルホストとリモートホスト間のスレッドの引き継ぎ(hand-offs)が導入され、自動化履歴の一括管理機能が向上しました。
  • エージェント化への進化: この動きは、テキストベースのAIアシスタンスから、複雑なソフトウェアインターフェースを操作できる自律的な「Computer Use」エージェントへの移行を意味しています。