OpenAI Codex חושף את Record & Replay לאוטומציה של תהליכי עבודה מורכבים

OpenAI הציגה תכונה משנתתור "Record & Replay" עבור אפליקציית Codex שלה ב-macOS, מה שמסמן קפיצת מדרגה משמעותית ביכולות של סוכנים אוטונומיים. באמצעות צפייה במשתמש מבצע רצף פעולות ידני, ה-AI יכול כעת להפוך פעולות אנושיות למיומנויות דיגיטליות קבועות וניתנות לשימוש חוזר.

מתצפית לאוטומציה: איך Record & Replay עובד

החדשנות המרכזית בעדכון האחרון של Codex היא היכולת להפוך תהליכי עבודה של סשן בודד לאוטומציות שניתנות לחזרה. במקום לכתוב סקריפטים מורכבים או הנחיות (prompts) כדי לתאר תהליך, משתמשים יכולים פשוט "להדריך" את סוכן ה-AI דרך משימה ספציפית. לדוגמה, משתמש יכול להדגים את כל תהליך העלאת סרטון ל-YouTube — כולל צירוף מטא-דאטה, בחירת תמונה ממוזערת (thumbnail) והעלאת כתוביות.

ברגע שההדגמה מסתיימת, Codex מקודד את הפעולות הללו ל"מיומנות" (skill). הסוכן יכול אז לבצע את הרצף כולו באופן עצמאי בעתיד. זה מזיז את האינטראקציה עם ה-AI מהנחיות פשוטות מבוססות צ'אט לעבר "Computer Use" אמיתי, שבו המודל מתקשר עם מערכת ההפעלה וממשקי האפליקציות בדיוק כפי שבן אדם היה עושה.

שיפורים טכניים ועדכוני גרסה 26.616

מעבר לתכונת Record & Replay, גרסה 26.616 מציגה עדכוני תשתית קריטיים המיועדים למשתמשים מתקדמים (power users) ומפתחים. פעולות אצווה (bulk actions) חדשות עבור היסטוריית האוטומציות מאפשרות ניהול טוב יותר של משימות שהוקלטו בעבר, בעוד שיושמה יכולת "hand-off" מתוחכמת. יכולת זו מאפשרת למשתמשים להעביר threads פעילים בין מכונה מקומית למארח מרוחק, מה שמאפשר המשכיות חלקה של משימות מורכבות על חומרה מחוברת.

כדי להשתמש בתכונות אוטומציה מתקדמות אלו, על המשתמשים להפעיל את אפשרות ה-"Computer Use". בעוד ש-Codex זמינה להורדה בחינם, יכולת החשיבה (reasoning) ברמה הגבוהה הנדרשת לביצוע תהליכי עבודה אלו מחייבת חשבון ChatGPT בתשלום.

זמינות אזורית ונוף ה-AI הרחב יותר

הפריסה של תכונות אלו נתקלת במגבלות גיאוגרפיות מסוימות. נכון לעכשיו, Record & Replay אינה זמינה בבריטניה, בשוויץ ובאיחוד האירופי. עם זאת, יכולת ה-"Computer Use" הבסיסית זמינה באיחוד האירופי מאז ה-16 ביוני, מה שמכין את הקרקע לשוויון בתכונות (feature parity) בעתיד.

פיתוח זה מהווה רגע מכונן עבור תעשיית ה-AI. אנו עדים למעבר של LLMs מלהיות רק "מנועי ידע" להפיכתם ל"מנועי פעולה". באמצעות שליטה ביכולת לצפות ולשחזר משימות מבוססות GUI, Codex ממצבת את OpenAI בעמדה שתאפשר לה לשלוט בתחום האוטומציה של עבודות צווארון לבן, ובכך הופכת למעשה את מערכת ההפעלה של שולחן העבודה לסביבה הנשלטת על ידי סוכנים חכמים במקום לחיצות ידניות.

נקודות מרכזיות

  • חיקוי התנהגותי: תכונת ה-Record & Replay החדשה מאפשרת ל-Codex להפוך הדגמה ידנית בודדת למיומנות אוטומציה ניתנת לשימוש חוזר.
  • ניהול זרימת עבודה מתקדם: גרסה 26.616 מציגה העברת threads בין מארחים מקומיים ומרוחקים וניהול קבוצתי משופר של היסטוריית האוטומציה.
  • אבולוציה סוכנית: מהלך זה מסמן מעבר מסיוע מבוסס טקסט של AI לסוכני "Computer Use" אוטונומיים המסוגלים לנווט בממשקי תוכנה מורכבים.