OpenAI Codex представляет Record & Replay для автоматизации сложных рабочих процессов

OpenAI представила революционную функцию «Record & Replay» для своего приложения Codex на macOS, что стало значительным скачком в возможностях автономных агентов. Наблюдая за тем, как пользователь выполняет последовательность действий вручную, ИИ теперь может преобразовывать действия человека в постоянные, многоразовые цифровые навыки.

От наблюдения к автоматизации: как работает Record & Replay

Ключевой инновацией в последнем обновлении Codex является возможность превращать разовые рабочие процессы в повторяемые автоматизации. Вместо написания сложных скриптов или промптов для описания процесса, пользователи могут просто «провести» ИИ-агента через выполнение конкретной задачи. Например, пользователь может продемонстрировать весь процесс загрузки видео на YouTube — включая добавление метаданных, выбор миниатюры и загрузку субтитров.

Как только демонстрация завершена, Codex кодирует эти действия в «навык» (skill). В дальнейшем агент сможет самостоятельно выполнять всю эту последовательность. Это переводит взаимодействие с ИИ от простых инструкций в чате к полноценному режиму «Computer Use», при котором модель взаимодействует с операционной системой и интерфейсами приложений точно так же, как это делал бы человек.

Технические улучшения и обновления версии 26.616

Помимо функции Record & Replay, версия 26.616 включает критически важные обновления инфраструктуры, разработанные для профессиональных опытных пользователей и разработчиков. Новые массовые действия в истории автоматизаций позволяют лучше управлять ранее записанными задачами, а также была реализована продвинутая функция «передачи» (hand-off). Это позволяет пользователям переносить активные потоки между локальной машиной и удаленным хостом, обеспечивая бесшовное продолжение сложных задач на подключенном оборудовании.

Чтобы использовать эти продвинутые функции автоматизации, у пользователей должна быть включена функция «Computer Use». Хотя Codex можно скачать бесплатно, для высокоуровневого логического вывода, необходимого для выполнения этих рабочих процессов, требуется платная учетная запись ChatGPT.

Региональная доступность и общий ландшафт ИИ

Внедрение этих функций сталкивается с некоторыми географическими ограничениями. В настоящее время Record & Replay недоступна в Великобритании, Швейцарии и ЕС. Однако базовая возможность «Computer Use» доступна в ЕС с 16 июня, что подготавливает почву для достижения паритета функций в будущем.

Это событие является поворотным моментом для индустрии ИИ. Мы наблюдаем переход от LLM, являющихся лишь «двигателями знаний», к превращению в «двигатели действий». Осваивая способность наблюдать за задачами в графическом интерфейсе (GUI) и воспроизводить их, Codex готовит почву для доминирования OpenAI в сфере автоматизации интеллектуального труда, фактически превращая настольную операционную систему в среду, управляемую интеллектуальными агентами, а не ручными кликами.

Основные выводы

  • Поведенческая мимикрия: Новая функция Record & Replay позволяет Codex преобразовывать одну ручную демонстрацию в многоразовый навык автоматизации.
  • Продвинутое управление рабочими процессами: Версия 26.616 внедряет передачу потоков (thread hand-offs) между локальными и удаленными хостами, а также улучшенное массовое управление историей автоматизации.
  • Эволюция агентного ИИ: Этот шаг знаменует переход от текстовой помощи ИИ к автономным агентам «Computer Use», способным ориентироваться в сложных программных интерфейсах.