OpenAI Codex قابلیت Record & Replay را برای خودکارسازی جریان‌های کاری پیچیده رونمایی کرد

OpenAI قابلیت تحول‌آفرین "Record & Replay" را برای اپلیکیشن Codex خود در macOS معرفی کرده است که نشان‌دهنده جهشی بزرگ در قابلیت‌های عامل‌های خودگردان (autonomous agents) است. هوش مصنوعی اکنون با مشاهده‌ی انجام یک توالی دستی توسط کاربر، می‌تواند اقدامات انسانی را به مهارت‌های دیجیتال دائمی و قابل استفاده مجدد تبدیل کند.

از مشاهده تا خودکارسازی: قابلیت Record & Replay چگونه کار می‌کند

نوآوری اصلی در آخرین به‌روزرسانی Codex، توانایی تبدیل جریان‌های کاری تک‌جلسه‌ای به خودکارسازی‌های تکرارپذیر است. کاربران به‌جای نوشتن اسکریپت‌ها یا پرامپت‌های پیچیده برای توصیف یک فرآیند، می‌توانند به‌سادگی عامل هوش مصنوعی را در انجام یک وظیفه خاص «راهنمایی» کنند. برای مثال، یک کاربر می‌تواند کل فرآیند آپلود یک ویدیو در YouTube را نمایش دهد—از جمله پیوست کردن متادیتا، انتخاب تصویر بندانگشتی (thumbnail) و آپلود زیرنویس.

پس از اتمام نمایش، Codex این اقدامات را در قالب یک «مهارت» (skill) کدگذاری می‌کند. سپس عامل می‌تواند این توالی کامل را در آینده به‌صورت مستقل اجرا کند. این امر تعامل با هوش مصنوعی را از دستورالعمل‌های ساده مبتنی بر چت، به سمت "Computer Use" واقعی سوق می‌دهد؛ جایی که مدل دقیقاً مانند یک انسان با سیستم‌عامل و رابط‌های کاربری اپلیکیشن‌ها تعامل برقرار می‌کند.

بهبودهای فنی و به‌روزرسانی‌های نسخه 26.616

فراتر از قابلیت Record & Replay، نسخه 26.616 به‌روزرسانی‌های زیرساختی حیاتی را معرفی می‌کند که برای کاربران حرفه‌ای و توسعه‌دهندگان طراحی شده است. اقدامات دسته‌جمعی (bulk actions) جدید برای تاریخچه Automations، مدیریت بهتر وظایف ضبط‌شده قبلی را امکان‌پذیر می‌کند، در حالی که قابلیت پیشرفته "hand-off" نیز پیاده‌سازی شده است. این قابلیت به کاربران اجازه می‌دهد تا رشته‌های (threads) فعال را بین یک ماشین محلی و یک میزبان از راه دور منتقل کنند و تداوم بی‌وقفه وظایف پیچیده را روی سخت‌افزارهای متصل فراهم آورند.

برای استفاده از این ویژگی‌های پیشرفته خودکارسازی، کاربران باید قابلیت "Computer Use" را فعال کرده باشند. اگرچه دانلود Codex رایگان است، اما استدلال سطح بالایی که برای اجرای این جریان‌های کاری لازم است، مستلزم داشتن یک حساب کاربری پولی ChatGPT است.

در دسترس بودن منطقه‌ای و چشم‌انداز گسترده‌تر هوش مصنوعی

عرضه این ویژگی‌ها با برخی محدودیت‌های جغرافیایی روبروست. در حال حاضر، Record & Replay در بریتانیا، سوئیس و اتحادیه اروپا در دسترس نیست. با این حال، قابلیت زیربنایی "Computer Use" از ۱۶ ژوئن در اتحادیه اروپا در دسترس بوده است که زمینه را برای برابری ویژگی‌ها در آینده فراهم می‌کند.

این تحول، لحظه‌ای سرنوشت‌ساز برای صنعت هوش مصنوعی است. ما شاهد تغییری هستیم که در آن LLMها از صرفاً «موتورهای دانش» به «موتورهای عمل» تبدیل می‌شوند. Codex با تسلط بر توانایی مشاهده و بازتولید وظایف مبتنی بر GUI، OpenAI را در موقعیتی قرار می‌دهد تا بر حوزه اتوماسیون کارهای اداری و تخصصی (white-collar) تسلط یابد و به‌طور مؤثری سیستم‌عامل دسکتاپ را به محیطی تبدیل کند که به جای کلیک‌های دستی، توسط عامل‌های هوشمند اداره می‌شود.

نکات کلیدی

  • تقلید رفتاری: ویژگی جدید Record & Replay به Codex اجازه می‌دهد تا یک نمایش دستی واحد را به یک مهارت اتوماسیون قابل استفاده مجدد تبدیل کند.
  • مدیریت پیشرفته جریان کار: نسخه 26.616 قابلیت انتقال رشته‌ها (thread hand-offs) بین میزبان‌های محلی و از راه دور و مدیریت دسته‌ای بهبودیافته برای تاریخچه اتوماسیون را معرفی می‌کند.
  • تکامل عامل‌محور: این حرکت نشان‌دهنده گذار از دستیار هوش مصنوعی مبتنی بر متن به عامل‌های خودمختار «Computer Use» است که قادر به پیمایش در رابط‌های نرم‌افزاری پیچیده هستند.