OpenAI Codex presenta Record & Replay para automatizar flujos de trabajo complejos

OpenAI ha introducido una función transformadora de "Record & Replay" para su aplicación Codex en macOS, lo que marca un salto significativo en las capacidades de los agentes autónomos. Al observar a un usuario realizar una secuencia manual, la IA ahora puede convertir las acciones humanas en habilidades digitales permanentes y reutilizables.

De la observación a la automatización: Cómo funciona Record & Replay

La innovación principal en la última actualización de Codex es la capacidad de transformar flujos de trabajo de una sola sesión en automatizaciones repetibles. En lugar de escribir scripts o prompts complejos para describir un proceso, los usuarios simplemente pueden "guiar" al agente de IA a través de una tarea específica. Por ejemplo, un usuario podría demostrar todo el proceso de subir un video a YouTube, incluyendo la adjunción de metadatos, la selección de una miniatura y la carga de subtítulos.

Una vez completada la demostración, Codex codifica estas acciones en una "habilidad" (skill). El agente puede entonces ejecutar toda esta secuencia de forma independiente en el futuro. Esto aleja la interacción con la IA de las simples instrucciones basadas en chat hacia un verdadero "Computer Use", donde el modelo interactúa con el sistema operativo y las interfaces de las aplicaciones tal como lo haría un humano.

Mejoras técnicas y actualizaciones de la versión 26.616

Más allá de la función Record & Replay, la versión 26.616 introduce actualizaciones críticas de infraestructura diseñadas para usuarios avanzados profesionales y desarrolladores. Las nuevas acciones por lotes para el historial de Automations permiten una mejor gestión de las tareas grabadas anteriormente, mientras que se ha implementado una sofisticada capacidad de "hand-off" (traspaso). Esto permite a los usuarios transferir hilos activos entre una máquina local y un host remoto, permitiendo la continuación fluida de tareas complejas en hardware conectado.

Para utilizar estas funciones avanzadas de automatización, los usuarios deben tener habilitado "Computer Use". Aunque Codex es gratuito para descargar, el razonamiento de alto nivel requerido para ejecutar estos flujos de trabajo requiere una cuenta de pago de ChatGPT.

Disponibilidad regional y el panorama general de la IA

El despliegue de estas funciones enfrenta algunas restricciones geográficas. Actualmente, Record & Replay no está disponible en el Reino Unido, Suiza y la UE. Sin embargo, la capacidad fundamental de "Computer Use" ha estado accesible en la UE desde el 16 de junio, preparando el terreno para una futura paridad de funciones.

Este desarrollo representa un momento crucial para la industria de la IA. Estamos siendo testigos de un cambio en el que los LLM dejan de ser meros "motores de conocimiento" para convertirse en "motores de acción". Al dominar la capacidad de observar y replicar tareas basadas en GUI, Codex está posicionando a OpenAI para dominar el campo de la automatización del trabajo administrativo, convirtiendo efectivamente el sistema operativo de escritorio en un entorno gobernado por agentes inteligentes en lugar de clics manuales.

Conclusiones clave

  • Mimetismo conductual: La nueva función Record & Replay permite que Codex convierta una única demostración manual en una habilidad de automatización reutilizable.
  • Gestión avanzada de flujos de trabajo: La versión 26.616 introduce el traspaso de hilos entre hosts locales y remotos y una gestión masiva mejorada para el historial de automatización.
  • Evolución agéntica: Este movimiento significa una transición de la asistencia de IA basada en texto a agentes autónomos de "Computer Use" capaces de navegar por interfaces de software complejas.