OpenAI Codex wprowadza Record & Replay, aby automatyzować złożone procesy pracy

OpenAI wprowadziło przełomową funkcję „Record & Replay” w swojej aplikacji Codex na system macOS, co stanowi znaczący krok naprzód w możliwościach autonomicznych agentów. Dzięki obserwacji użytkownika wykonującego manualną sekwencję działań, sztuczna inteligencja może teraz przekształcać ludzkie czynności w trwałe, wielokrotnego użytku cyfrowe umiejętności.

Od obserwacji do automatyzacji: Jak działa Record & Replay

Kluczową innowacją w najnowszej aktualizacji Codex jest możliwość przekształcania jednorazowych procesów pracy w powtarzalne automatyzacje. Zamiast pisać złożone skrypty lub polecenia (prompty), aby opisać proces, użytkownicy mogą po prostu „przeprowadzić” agenta AI przez konkretne zadanie. Na przykład użytkownik może zaprezentować cały proces przesyłania filmu na YouTube – wraz z dodawaniem metadanych, wybieraniem miniatury i przesyłaniem napisów.

Po zakończeniu demonstracji Codex koduje te działania jako „umiejętność” (skill). Agent może następnie samodzielnie wykonywać całą tę sekwencję w przyszłości. Przesuwa to interakcję z AI od prostych instrukcji opartych na czacie w stronę prawdziwego „Computer Use”, gdzie model wchodzi w interakcję z systemem operacyjnym i interfejsami aplikacji w taki sam sposób, jak robi to człowiek.

Ulepszenia techniczne i aktualizacje wersji 26.616

Poza funkcją Record & Replay, wersja 26.616 wprowadza krytyczne aktualizacje infrastruktury zaprojektowane z myślą o profesjonalnych użytkownikach zaawansowanych i programistach. Nowe operacje masowe w historii automatyzacji (Automations history) pozwalają na lepsze zarządzanie wcześniej nagranymi zadaniami, natomiast zaimplementowano zaawansowaną funkcję „hand-off”. Pozwala ona użytkownikom na przenoszenie aktywnych wątków między maszyną lokalną a hostem zdalnym, co umożliwia płynną kontynuację złożonych zadań na podłączonym sprzęcie.

Aby korzystać z tych zaawansowanych funkcji automatyzacji, użytkownicy muszą mieć włączoną funkcję „Computer Use”. Choć aplikacja Codex jest darmowa do pobrania, wysoki poziom rozumowania wymagany do wykonywania tych procesów wymaga płatnego konta ChatGPT.

Dostępność regionalna i szerszy krajobraz AI

Wdrażanie tych funkcji napotyka pewne ograniczenia geograficzne. Obecnie funkcja Record & Replay jest niedostępna w Wielkiej Brytanii, Szwajcarii oraz w Unii Europejskiej. Jednakże podstawowa funkcja „Computer Use” jest dostępna w UE od 16 czerwca, co przygotowuje grunt pod przyszłą pełną równorzędność funkcji.

Ten rozwój stanowi przełomowy moment dla branży AI. Jesteśmy świadkami zmiany, w której modele LLM przestają być jedynie „silnikami wiedzy”, a stają się „silnikami działania”. Dzięki opanowaniu umiejętności obserwowania i powielania zadań opartych na GUI, Codex pozycjonuje OpenAI do zdominowania dziedziny automatyzacji pracy umysłowej, skutecznie zmieniając system operacyjny komputera stacjonarnego w środowisko zarządzane przez inteligentne agenty, a nie ręczne kliknięcia.

Kluczowe wnioski

  • Mimikra behawioralna: Nowa funkcja Record & Replay pozwala Codex na przekształcenie pojedynczej manualnej demonstracji w wielokrotnego użytku umiejętność automatyzacji.
  • Zaawansowane zarządzanie przepływem pracy: Wersja 26.616 wprowadza przekazywanie wątków między hostami lokalnymi a zdalnymi oraz ulepszone zarządzanie masowe historii automatyzacji.
  • Ewolucja agentowa: Ten krok oznacza przejście od tekstowej pomocy AI do autonomicznych agentów „Computer Use”, zdolnych do nawigowania po złożonych interfejsach oprogramowania.