בתוך המתמטיקה: כיצד שבב ה-Jalapeño של OpenAI מכוון לכלכלה של בינה מלאכותית

OpenAI פועלת באגרסיביות כדי לנתק את הצמיחה שלה מהעלויות המטפסות של חומרה מצד שלישי על ידי פיתוח סיליקון מותאם אישית משלה. שבב ה-"Jalapeño" החדש, מעגל משולב ייעודי (ASIC) שתוכנן בשיתוף פעולה עם Broadcom, מייצג ציר אסטרטגי לעבר אינטגרציה אנכית במטרה לייעל את הכלכלה של תהליכי ה-inference.

שבירת התלות ב-Nvidia

במשך שנים, תעשיית ה-AI הוגדרה על ידי מחזור הוצאות הון (CapEx) מאסיבי הנשלט על ידי Nvidia. כאשר Nvidia מחזיקה כיום בשולי רווח מוערכים של כ-75%, עלות האימון והפריסה של מודלים בקנה מידה גדול הפכה לחסם משמעותי להרחבת האינטליגנציה. פיתוח שבב ה-Jalapeño של OpenAI הוא תגובה ישירה ללחץ כלכלי זה.

באמצעות מעבר ממעבדים גרפיים (GPUs) לשימוש כללי ל-ASIC ייעודי, OpenAI שואפת להפחית משמעותית את ה"מס" המשולם לספקי חומרה. בניגוד ל-GPUs של Nvidia, שנועדו למגוון רחב של משימות מחשוב מקבילי, שבב ה-Jalapeño מתוכנן ארכיטקטונית במיוחד כדי לטפל בעומסי העבודה המתמטיים הטבועים בתהליכי inference של LLM. התמחות זו מאפשרת יעילות גבוהה יותר, צריכת חשמל נמוכה יותר, ובסופו של דבר, עלות נמוכה יותר לכל טוקן (token).

שיתוף הפעולה עם Broadcom ויתרונות ה-ASIC

השותפות עם Broadcom היא מרכיב קריטי באסטרטגיה זו. Broadcom היא ותיקה בתחום המוליכים למחצה, המספקת את המומחיות הטכנית הדרושה כדי לעבור מתכנון ארכיטקטוני לייצור סיליקון פיזי. באמצעות שימוש בגישת ASIC, OpenAI יכולה להטמיע את הפעולות המתמטיות הספציפיות הנדרשות על ידי המודלים שלה — כגון כפל מטריצות ומנגנוני קשב (attention mechanisms) — ישירות בתוך מעגלי החומרה.

רמת אופטימיזציה כזו קשה להשגה באמצעות חומרה לשימוש כללי. ASIC יכול להסיר את העומס של תכונות שאינן בשימוש, ולהקדיש שטח שבב (die area) גדול יותר ליחידות החישוב החשובות ביותר עבור ארכיטקטורות מבוססות transformer. עבור מפתחים ומייסדים, שינוי זה מרמז על עתיד שבו פריסת מודלים תהיה בת קיימא מבחינה כלכלית, מה שעשוי לאפשר הרצה של מודלי הסקה (reasoning models) מורכבים יותר בשבריר מהעלויות הנוכחיות.

השלכות על נוף התשתית של ה-AI

הופעתו של שבב ה-Jalapeño מסמנת שינוי רחב יותר בתעשיית ה-AI: עידן ה-"Model-Hardware Co-design" (תכנון משותף של מודל וחומרה). ככל שמודלי הקצה (frontier models) הופכים למתמחים יותר, הפער בין מה שחומרה לשימוש כללי יכולה לעשות לבין מה שסיליקון מותאם אישית יכול להשיג רק ילך ויתרחב.

אם OpenAI תצליח להרחיב את השימוש בסיליקון המותאם אישית הזה, היא תיצור חפיר (moat) אדיר. זה לא רק מפחית את העלות הישירה של ההתרחבות, אלא גם מספק מחסנית (stack) קניינית של חומרה ותוכנה שמתחרים הנשענים אך ורק על שבבים מוכנים מהמדף (off-the-shelf) עלולים להתקשות להשתוות לה מבחינת יחס עלות-ביצועים. מהלך זה מחייב הערכה מחדש של שרשרת הערך כולה של ה-AI, ודוחף את התעשייה לעבר מודל שבו מעבדות ה-AI המצליחות ביותר הן גם אדריכלי החומרה היעילים ביותר.

נקודות מפתח

  • צמצום עלויות: שבב ה-Jalapeño הוא מהלך אסטרטגי להפחתת הוצאות הון מאסיביות ועקיפת שולי הרווח הגבוהים של ספקי חומרה כמו Nvidia.
  • ארכיטקטורה ייעודית: ה-ASIC הזה, שפותח בשיתוף פעולה עם Broadcom, מותאם במיוחד לדרישות המתמטיות של inference של LLM ולא למחשוב לשימוש כללי.
  • אינטגרציה אנכית: OpenAI עוברת למודל של תכנון משותף (co-design), שבו סיליקון מותאם אישית ותוכנה מתקדמת עובדים בשיתוף פעולה כדי להוריד את העלות לכל טוקן ולאפשר קנה מידה מאסיבי.