OpenAI Codex представляє Record & Replay для автоматизації складних робочих процесів
OpenAI представила революційну функцію «Record & Replay» для свого додатка Codex на macOS, що знаменує собою значний стрибок у можливостях автономних агентів. Спостерігаючи за тим, як користувач виконує послідовність ручних дій, ШІ тепер може перетворювати дії людини на постійні, багаторазові цифрові навички.
Від спостереження до автоматизації: як працює Record & Replay
Основною інновацією в останньому оновленні Codex є можливість перетворювати робочі процеси однієї сесії на повторювані автоматизації. Замість написання складних скриптів або промптів для опису процесу, користувачі можуть просто «провести» ШІ-агента через конкретне завдання. Наприклад, користувач може продемонструвати весь процес завантаження відео на YouTube — включаючи додавання метаданих, вибір мініатюри та завантаження субтитрів.
Після завершення демонстрації Codex кодує ці дії у «навичку» (skill). Потім агент може самостійно виконувати всю цю послідовність у майбутньому. Це переводить взаємодію з ШІ від простих інструкцій у чаті до справжнього «Computer Use», де модель взаємодіє з операційною системою та інтерфейсами додатків так само, як це робила б людина.
Технічні вдосконалення та оновлення версії 26.616
Окрім функції Record & Replay, версія 26.616 впроваджує критичні оновлення інфраструктури, розроблені для професійних досвідчених користувачів та розробників. Нові групові дії для історії автоматизацій (Automations history) дозволяють краще керувати раніше записаними завданнями, а також було реалізовано складну можливість «передачі» (hand-off). Це дозволяє користувачам переносити активні потоки між локальною машиною та віддаленим хостом, забезпечуючи безперервне продовження складних завдань на підключеному обладнанні.
Щоб використовувати ці розширені функції автоматизації, користувачі повинні мати увімкнену функцію «Computer Use». Хоча Codex доступний для безкоштовного завантаження, високий рівень міркування, необхідний для виконання цих робочих процесів, потребує платного облікового запису ChatGPT.
Регіональна доступність та ширший ландшафт ШІ
Впровадження цих функцій стикається з певними географічними обмеженнями. Наразі Record & Replay недоступна у Великобританії, Швейцарії та ЄС. Однак базова можливість «Computer Use» є доступною в ЄС з 16 червня, що створює основу для майбутньої паритетності функцій.
Цей розвиток є поворотним моментом для індустрії ШІ. Ми спостерігаємо перехід від LLM як простих «двигунів знань» до перетворення на «двигуни дій». Опановуючи здатність спостерігати та відтворювати завдання в GUI, Codex готує OpenAI до домінування у сфері автоматизації офісної роботи, фактично перетворюючи десктопну операційну систему на середовище, кероване інтелектуальними агентами, а не ручними кліками.
Основні висновки
- Мімікрія поведінки: Нова функція Record & Replay дозволяє Codex перетворювати одну ручну демонстрацію на навичку автоматизації, яку можна використовувати повторно.
- Розширене управління робочими процесами: Версія 26.616 впроваджує передачу потоків між локальними та віддаленими хостами, а також покращене масове управління історією автоматизації.
- Агентна еволюція: Цей крок означає перехід від текстової допомоги ШІ до автономних агентів «Computer Use», здатних навігувати у складних програмних інтерфейсах.