OpenAI Codex, 복잡한 워크플로 자동화를 위한 Record & Replay 기능 공개

OpenAI가 macOS용 Codex 앱에 혁신적인 "Record & Replay" 기능을 도입하며 자율 에이전트 역량의 중대한 도약을 이뤄냈습니다. 사용자가 수동으로 작업을 수행하는 과정을 관찰함으로써, AI는 이제 인간의 행동을 영구적이고 재사용 가능한 디지털 기술로 변환할 수 있습니다.

관찰에서 자동화로: Record & Replay의 작동 방식

최신 Codex 업데이트의 핵심 혁신은 단일 세션 워크플로를 반복 가능한 자동화로 변환하는 능력입니다. 프로세스를 설명하기 위해 복잡한 스크립트나 프롬프트를 작성하는 대신, 사용자는 AI 에이전트에게 특정 작업을 직접 "보여주는(walk)" 것만으로 충분합니다. 예를 들어, 메타데이터 첨부, 썸네일 선택, 자막 업로드를 포함한 유튜브 동영상 업로드의 전체 과정을 시연할 수 있습니다.

시연이 완료되면 Codex는 이러한 동작들을 하나의 "skill"로 인코딩합니다. 그러면 에이전트는 향후 이 전체 시퀀스를 독립적으로 실행할 수 있습니다. 이는 AI 상호작용을 단순한 채팅 기반 지시에서 벗어나, 모델이 인간과 마찬가지로 운영 체제 및 애플리케이션 인터페이스와 상호작용하는 진정한 "Computer Use" 단계로 진화시킵니다.

기술적 향상 및 버전 26.616 업데이트

Record & Replay 기능 외에도, 버전 26.616은 전문 파워 유저와 개발자를 위해 설계된 중요한 인프라 업데이트를 도입했습니다. Automations 히스토리에 새로운 일괄 작업(bulk actions) 기능이 추가되어 이전에 기록된 작업을 더 효율적으로 관리할 수 있으며, 정교한 "hand-off" 기능도 구현되었습니다. 이를 통해 사용자는 로컬 머신과 원격 호스트 간에 활성 스레드를 전송할 수 있어, 연결된 하드웨어에서 복잡한 작업을 끊김 없이 이어갈 수 있습니다.

이러한 고급 자동화 기능을 활용하려면 "Computer Use"가 활성화되어 있어야 합니다. Codex는 무료로 다운로드할 수 있지만, 이러한 워크플로를 실행하는 데 필요한 고도의 추론을 위해서는 유료 ChatGPT 계정이 필요합니다.

지역별 가용성 및 광범위한 AI 환경

이러한 기능의 출시는 일부 지리적 제약을 받습니다. 현재 Record & Replay는 영국, 스위스 및 EU 지역에서는 사용할 수 없습니다. 하지만 기초가 되는 "Computer Use" 기능은 지난 6월 16일부터 EU에서 사용 가능해졌으며, 이는 향후 기능적 동등성을 확보하기 위한 발판을 마련했습니다.

이번 발전은 AI 산업에 있어 중대한 전환점입니다. 우리는 LLM이 단순한 '지식 엔진'에서 '실행 엔진'으로 변화하는 과정을 목격하고 있습니다. GUI 기반 작업을 관찰하고 복제하는 능력을 마스터함으로써, Codex는 OpenAI가 화이트칼라 업무 자동화 분야를 장악할 수 있도록 포지셔닝하고 있으며, 결과적으로 데스크톱 운영 체제를 수동 클릭이 아닌 지능형 에이전트가 제어하는 환경으로 탈바꿈시키고 있습니다.

핵심 요약

  • 행동 모방(Behavioral Mimicry): 새로운 Record & Replay 기능은 Codex가 단 한 번의 수동 시연을 재사용 가능한 자동화 기술로 변환할 수 있게 해줍니다.
  • 고급 워크플로 관리: 버전 26.616에서는 로컬 및 원격 호스트 간의 스레드 핸드오프(thread hand-offs) 기능과 자동화 기록에 대한 개선된 일괄 관리 기능을 도입했습니다.
  • 에이전트 중심의 진화: 이러한 움직임은 텍스트 기반의 AI 보조에서 복잡한 소프트웨어 인터페이스를 탐색할 수 있는 자율적인 '컴퓨터 사용(Computer Use)' 에이전트로의 전환을 의미합니다.