OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

Translated for your language. Read the original.

AI-assisted draft.

OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

In this article

OpenAI ו-Broadcom חושפות את Jalapeño: שבב מותאם אישית להסקה (inference) של LLM

OpenAI עוברת רשמית מעבר לתוכנה על ידי כניסה לתחום הסיליקון המותאם אישית עם ההכרזה על "Jalapeño", מעבד בינה (Intelligence Processor) ייעודי. מאיץ מותאם אישית זה, שפותח בשיתוף פעולה עם Broadcom, נועד לייעל הסקה (inference) של מודלי שפה גדולים (LLM) בקנה מידה עצום.

ארכיטקטורה שנבנתה למטרה ספציפית עבור LLMs מודרניים

בניגוד לפתרונות רבים כיום המסתמכים על GPUs בעלי שימוש כללי שעברו התאמה, Jalapeño הוא תכנון מאפס (ground-up design) שתוכנן במיוחד עבור הדרישות הייחודיות של הסקת LLM. המטרה היא לפתור את צווארי הבקבוק העיקריים של ה-AI המודרני: תנועת נתונים ותת-ניצול של החומרה. על ידי אופטימיזציה של הארכיטקטורה כדי להביא את רמת הניצול קרוב יותר למקסימום התיאורטי שלה, OpenAI שואפת לשפר משמעותית את הביצועים לכל וואט בהשוואה לחומרת ה-state-of-the-art הנוכחית.

בעוד ש-OpenAI טרם פרסמה דוח טכני סופי או מדדים (benchmarks) עצמאיים, בדיקות פנימיות מוקדמות מצביעות על שיפורים משמעותיים ביעילות. דגימות הנדסיות כבר נמצאות בשימוש בסביבות מעבדה להרצת עומסי עבודה מורכבים של למידת מכונה, כולל מודל GPT-5.3-Codex-Spark — מודל שכרגע מסתמך על חומרת Cerebras לצורכי ההסקה שלו.

שיתוף פעולה עוצמתי בין מספר חברות

הפיתוח של Jalapeño הוא מאמץ מתוחכם של מספר שותפים המשתרע על פני כל מחסנית החומרה (hardware stack). OpenAI מובילה את תכנון השבב, תוך ניצול מודלי ה-AI שלה כדי להאיץ את מחזור הפיתוח, שלטענת דיווחים ארך תשעה חודשים בלבד מתכנון ועד ל-tape-out. Broadcom מספקת את המומחיות הקריטית בייצור סיליקון וטכנולוגיית רשת מתקדמת, כולל שבבי הרשת בעלי הביצועים הגבוהים מסדרת Tomahawk שלה. להשלמת המערכת (ecosystem), חברת Celestica אחראית על הלוחות, ה-racks ושילוב המערכת המלא.

שיתוף פעולה זה מייצג שינוי אסטרטגי עבור OpenAI, המעבר מחברה המתמקדת אך ורק במודלים ובמוצרים לחברה השולטת במחסנית החומרה שבבסיס הטכנולוגיה. על ידי בעלות על הסיליקון, OpenAI יכולה תיאורטית להריץ את המודלים שלה מהר יותר, בצורה אמינה יותר ובעלות נמוכה בהרבה מאשר מתחרים המסתמכים על ספקי צד שלישי.

התרחבות לרמות של ג'יגה-וואט עד שנת 2026

מפת הדרכים של Jalapeño שאפתנית ביותר. מנכ"ל Broadcom, Hock Tan, ציין כי הפריסה הראשונה מתוכננת לסוף 2026, במטרה לפעול בקנה מידה של ג'יגה-וואט לצד Microsoft ושותפים אסטרטגיים נוספים. היקף הפריסה מדגיש את דרישות התשתית העצומות של הדור הבא של ה-AI.

דיווחים מצביעים על כך שהשותפות כוללת התחייבויות מסחריות משמעותיות, כאשר Microsoft צפויה להבטיח רכישה של 40 אחוזים מייצור השבבים הראשוני כדי להבטיח את השלב הראשון. רמה זו של אינטגרציה אנכית וביקוש מובטח מסמנת מהלך משמעותי לעבר ייצוב שרשרת האספקה בעלת העלות והאנרגיה הגבוהות, הנדרשת כדי לתחזק את מהפכת ה-AI.

נקודות מרכזיות

אסטרטגיית סיליקון מותאם אישית: Jalapeño הוא "מעבד בינה" (Intelligence Processor) שתוכנן מאפס עבור הסקת

OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

OpenAI ו-Broadcom חושפות את Jalapeño: שבב מותאם אישית להסקה (inference) של LLM

ארכיטקטורה שנבנתה למטרה ספציפית עבור LLMs מודרניים

שיתוף פעולה עוצמתי בין מספר חברות

התרחבות לרמות של ג'יגה-וואט עד שנת 2026

נקודות מרכזיות

Continue reading

OpenAI חושפת את Jalapeño: שבב ה-AI הראשון שלה להסקה בעיצוב מותאם אישית

OpenAI חושפת את Jalapeño: שבב ה-AI הראשון שלה המותאם אישית להסקה

מאחורי המתמטיקה: כיצד שבב ה-Jalapeño של OpenAI מכוון לכלכלה של בינה מלאכותית

שבב ה-Jalapeño של OpenAI: שינוי אסטרטגי הרחק מהדומיננטיות של Nvidia

שבב ה-Jalapeño של OpenAI: כיצד OpenAI מקצצת בעלויות ה-AI ב-50%