OpenAI Codex enthüllt „Record & Replay“, um komplexe Workflows zu automatisieren

OpenAI hat eine transformative „Record & Replay“-Funktion für seine Codex-App auf macOS eingeführt, was einen bedeutenden Sprung in den Fähigkeiten autonomer Agenten darstellt. Indem die KI beobachtet, wie ein Nutzer eine manuelle Abfolge ausführt, kann sie menschliche Handlungen nun in dauerhafte, wiederverwendbare digitale Fähigkeiten umwandeln.

Von der Beobachtung zur Automatisierung: So funktioniert Record & Replay

Die Kerninnovation im neuesten Codex-Update ist die Fähigkeit, Workflows einer einzelnen Sitzung in wiederholbare Automatisierungen zu verwandeln. Anstatt komplexe Skripte oder Prompts zu schreiben, um einen Prozess zu beschreiben, können Nutzer den KI-Agenten einfach durch eine bestimmte Aufgabe „führen“. Ein Nutzer könnte beispielsweise den gesamten Prozess des Hochladens eines YouTube-Videos demonstrieren – einschließlich des Anhängens von Metadaten, der Auswahl eines Vorschaubildes und des Hochladens von Untertiteln.

Sobald die Demonstration abgeschlossen ist, kodiert Codex diese Aktionen in einen „Skill“. Der Agent kann diese gesamte Sequenz in Zukunft dann unabhängig ausführen. Dies verlagert die KI-Interaktion weg von einfachen chatbasierten Anweisungen hin zu echtem „Computer Use“, bei dem das Modell mit dem Betriebssystem und den Anwendungsschnittstellen interagiert, genau wie ein Mensch es tun würde.

Technische Erweiterungen und Updates der Version 26.616

Über die Record & Replay-Funktion hinaus führt die Version 26.616 kritische Infrastruktur-Updates ein, die für professionelle Power-User und Entwickler konzipiert sind. Neue Massenaktionen für den Automationsverlauf ermöglichen eine bessere Verwaltung zuvor aufgezeichneter Aufgaben, während eine hochentwickelte „Hand-off“-Funktion implementiert wurde. Diese ermöglicht es Nutzern, aktive Threads zwischen einer lokalen Maschine und einem Remote-Host zu übertragen, was die nahtlose Fortsetzung komplexer Aufgaben auf verbundener Hardware ermöglicht.

Um diese fortschrittlichen Automatisierungsfunktionen zu nutzen, müssen Nutzer „Computer Use“ aktiviert haben. Während Codex kostenlos zum Download bereitsteht, erfordert das für die Ausführung dieser Workflows notwendige hochgradige logische Denken ein kostenpflichtiges ChatGPT-Konto.

Regionale Verfügbarkeit und die breitere KI-Landschaft

Der Rollout dieser Funktionen unterliegt gewissen geografischen Einschränkungen. Derzeit ist Record & Replay im Vereinigten Königreich, in der Schweiz und in der EU nicht verfügbar. Die grundlegende „Computer Use“-Funktion ist jedoch in der EU seit dem 16. Juni zugänglich, was den Weg für eine künftige Funktionsgleichheit ebnet.

Diese Entwicklung ist ein entscheidender Moment für die KI-Branche. Wir erleben einen Wandel von LLMs, die lediglich „Wissensmaschinen“ sind, hin zu „Handlungsmaschinen“. Durch die Beherrschung der Fähigkeit, GUI-basierte Aufgaben zu beobachten und zu replizieren, positioniert Codex OpenAI so, dass es den Bereich der Automatisierung von White-Collar-Arbeiten dominiert und das Desktop-Betriebssystem effektiv in eine Umgebung verwandelt, die von intelligenten Agenten statt von manuellen Klicks gesteuert wird.

Wichtigste Erkenntnisse

  • Verhaltensmimikry: Die neue Record-&-Replay-Funktion ermöglicht es Codex, eine einzelne manuelle Demonstration in eine wiederverwendbare Automatisierungsfähigkeit umzuwandeln.
  • Erweitertes Workflow-Management: Version 26.616 führt Thread-Übergaben zwischen lokalen und Remote-Hosts sowie ein verbessertes Massenmanagement für die Automatisierungshistorie ein.
  • Agentische Evolution: Dieser Schritt signalisiert den Übergang von textbasierter KI-Unterstützung zu autonomen „Computer Use“-Agenten, die in der Lage sind, komplexe Softwareoberflächen zu navigieren.