מאמר של OpenAI מדליף סדרת מודלים חדשה ומדורגת של GPT-5.6 Pro
מאמר בן-מבחן (benchmark) בתחום הגנומיקה שפורסם לאחרונה על ידי OpenAI חשף בשוגג את העתיד של ChatGPT Pro. במקום מודל דגל יחיד, הנתונים מצביעים על כך ש-OpenAI מכינה סדרת "Pro" מתוחכמת בעלת שלושה דרגים, שנועדה לאזן בין כוח הסקה (reasoning), קצב עיבוד (throughput) ועלות.
שלושת עמודי התווך: Sol, Terra, ו-Luna Pro
במשך חלק ניכר מההיסטוריה שלה, הצעת ה-"Pro" של OpenAI תפקדה כדרג יחיד ומונוליטי – המודל הטוב ביותר הזמין למשתמשים מתקדמים. עם זאת, מאמר הגנומיקה שדלף מציג שלושה וריאנטים נפרדים של "Pro (Extended)" המשקפים את ארכיטקטורת GPT-5.6 הקיימת: Sol Pro, Terra Pro, ו-Luna Pro.
בהתבסס על המבחנים, מודלים אלו מסווגים לפי השימושיות המיועדת שלהם:
- Sol Pro: כוח מחשוב עוצמתי בעל יכולת הסקה גבוהה, המיועד למשימות אנליטיות מורכבות ורב-שלביות ביותר.
- Terra Pro: וריאנט בעל נפח גבוה, המותאם לעומסי עבודה עסקיים מאסיביים ולקצב עיבוד בקנה מידה ארגוני.
- Luna Pro: וריאנט קל, מהיר וחסכוני המיועד לשאילתות יומיומיות בתדירות גבוהה.
בחינת קפיצת הביצועים באמצעות מבחני ביצועים
מבחן הגנומיקה מספק ראיות קונקרטיות להפרש בביצועים (performance delta) בין המודלים הסטנדרטיים לבין מקביליהם מסוג Pro. המחקר מדד "שיעור מעבר" (pass rate) – היכולת להשלים ניתוח רב-שלבי ללא שגיאה – על פני סדרה של 129 משימות.
התוצאות מצביעות על כך שוריאנטים מסוג Pro מציעים שיפור משמעותי באינטליגנציה, במיוחד עבור הדרגים הנמוכים יותר. Sol Pro הופיע כמוביל ללא עוררין, עם שיעור מעבר של 31.5%. תוצאה זו עולה על מודל Sol הסטנדרטי (28.7%) ומעלה משמעותית על ה"כבדים" הנוכחיים בתעשייה, כמו Claude Opus 4.8, שקיבל ציון של 16.0%.
מעניין לציין כי ה-"Pro boost" אינו אחיד. הנתונים מראים כי כוח מחשוב נוסף מספק תשואה פוחתת ככל שמורכבות המודל עולה. בעוד ש-Luna Pro הציג קפיצה אדירה של 7 נקודות לעומת הגרסה הסטנדרטית שלו, Sol Pro הציג עלייה צנועה יותר של פחות מ-3 נקודות. ראוי לציין כי Terra Pro הגיע לשיעור מעבר של 28.5%, מה שאומר שמודל ה-Pro בעל הנפח הגבוה של OpenAI מתפקד כמעט באותה רמה כמו מודל הדגל הסטנדרטי Sol.
שינוי אסטרטגי בפריסת בינה מלאכותית
חשיפה זו מסמנת שינוי יסודי באסטרטגיית המוצר של OpenAI. על ידי התרחקות מדרג Pro של "מידה אחת שמתאימה לכולם" (one-size-fits-all), OpenAI נותנת מענה לנקודת החיכוך העיקרית של מפתחים וארגונים: האיזון (trade-off) בין אינטליגנציה ליעילות.
אספקת "Terra Pro" שמתאימה לרמת האינטליגנציה של מודל הדגל אך מותאמת לנפחים גבוהים, מאפשרת לחברות להרחיב (scale) סוכני AI ללא העלויות המופרזות של מודל הסקה טהור. באופן דומה, "Luna Pro" מציע פתרון ביניים למשתמשים הזקוקים לאמינות גבוהה יותר ממודל סטנדרטי, אך אינם יכולים להצדיק את השיהוי (latency) של הרצת Sol מלאה.
בעוד ש-OpenAI לא התייחסה רשמית לשמות הללו או לעלויות ה-token הספציפיות – אשר נעדרות באופן בולט מחישובי כוח המחשוב במאמר – מפת הדרכים הטכנית ברורה. עידן מודל הדגל היחיד מסתיים, ובמקומו מגיעה מערכת אקולוגית (ecosystem) מתמחה של מודלים ברמה מקצועית.
נקודות מפתח
- ארכיטקטורת Pro מדורגת: נראה ש-OpenAI עוברת לסדרת שלושה מודלים מסוג Pro (Sol, Terra, ו-Luna) במקום מנוי יחיד בדרג הגבוה ביותר.
- יכולת הסקה עדיפה:
