OpenAI आणि Broadcom ने Jalapeño चे अनावरण केले: LLM इन्फरन्ससाठी एक कस्टम चिप
"Jalapeño" या समर्पित Intelligence Processor च्या घोषणेसह, OpenAI आता सॉफ्टवेअरच्या पलीकडे जाऊन कस्टम सिलिकॉन क्षेत्रात पाऊल टाकत आहे. Broadcom च्या भागीदारीत विकसित केलेली ही कस्टम अॅक्सिलरेटर (accelerator) मोठ्या प्रमाणावर Large Language Model (LLM) इन्फरन्स ऑप्टिमाइझ करण्यासाठी डिझाइन केलेली आहे.
आधुनिक LLMs साठी खास तयार केलेली आर्किटेक्चर
सध्याच्या अनेक सोल्यूशन्सप्रमाणे, जे सुधारित जनरल-पर्पज GPUs वर अवलंबून आहेत, त्यापेक्षा वेगळे Jalapeño हे पूर्णपणे नवीन डिझाइन असून ते विशेषतः LLM इन्फरन्सच्या अद्वितीय गरजांसाठी तयार करण्यात आले आहे. आधुनिक AI मधील मुख्य अडथळे (bottlenecks) दूर करणे, म्हणजेच डेटा मूव्हमेंट आणि हार्डवेअरचा अपूर्ण वापर (underutilization) सोडवणे हे याचे उद्दिष्ट आहे. आर्किटेक्चर ऑप्टिमाइझ करून त्याचा वापर त्याच्या सैद्धांतिक कमाल मर्यादेपर्यंत (theoretical maximum) नेऊन, सध्याच्या अत्याधुनिक हार्डवेअरच्या तुलनेत 'परफॉर्मन्स प्रति वॅट' (performance per watt) लक्षणीयरीत्या सुधारण्याचे OpenAI चे लक्ष्य आहे.
जरी OpenAI ने अद्याप कोणताही अंतिम तांत्रिक अहवाल किंवा स्वतंत्र बेंचमार्क प्रसिद्ध केले नसले तरी, सुरुवातीच्या अंतर्गत चाचण्यांमधून कार्यक्षमतेमध्ये मोठी वाढ झाल्याचे दिसून येत आहे. GPT-5.3-Codex-Spark सारख्या जटिल मशीन लर्निंग वर्कलोड्स चालवण्यासाठी लॅब वातावरणात इंजिनिअरिंग सॅम्पल्सचा वापर केला जात आहे—हे असे मॉडेल आहे जे सध्या त्याच्या इन्फरन्स गरजांसाठी Cerebras हार्डवेअरवर अवलंबून आहे.
बहु-कंपनी शक्तीशाली सहकार्य
Jalapeño चा विकास हा संपूर्ण हार्डवेअर स्टॅक व्यापणारा एक प्रगत बहु-भागीदार प्रयत्न आहे. OpenAI चिप डिझाइनचे नेतृत्व करत असून, विकास चक्र वेगवान करण्यासाठी स्वतःच्या AI मॉडेल्सचा वापर करत आहे; असे समजते की डिझाइनपासून 'टेप-आउट' (tape-out) पर्यंत याला केवळ नऊ महिने लागले. Broadcom महत्त्वपूर्ण सिलिकॉन मॅन्युफॅक्चरिंग तज्ज्ञता आणि प्रगत नेटवर्किंग तंत्रज्ञान प्रदान करते, ज्यामध्ये त्यांच्या हाय-परफॉर्मन्स Tomahawk नेटवर्किंग चिप्सचा समावेश आहे. या इकोसिस्टमला पूर्ण करण्यासाठी, Celestica बोर्ड्स, रॅक्स आणि संपूर्ण सिस्टम इंटिग्रेशनसाठी जबाबदार आहे.
हे सहकार्य OpenAI साठी एक धोरणात्मक बदल दर्शवते, जिथे कंपनी केवळ मॉडेल्स आणि उत्पादनांवर लक्ष केंद्रित करण्याऐवजी आता मूळ हार्डवेअर स्टॅकवर नियंत्रण मिळवत आहे. स्वतःचे सिलिकॉन असल्यामुळे, OpenAI सैद्धांतिकदृष्ट्या तृतीय-पक्ष पुरवठादारांवर अवलंबून असलेल्या स्पर्धकांच्या तुलनेत आपली मॉडेल्स अधिक वेगाने, अधिक विश्वासार्हतेने आणि खूप कमी खर्चात चालवू शकते.
२०२६ पर्यंत गिगावॅट स्तरापर्यंत विस्तार
Jalapeño चा रोडमॅप अत्यंत महत्त्वाकांक्षी आहे. Broadcom चे CEO Hock Tan यांनी सूचित केले आहे की, पहिले उपयोजन (deployment) २०२६ च्या उत्तरार्धात नियोजित आहे, ज्याचा उद्देश Microsoft आणि इतर धोरणात्मक भागीदारांसह गिगावॅट स्तरावर काम करण्याचा आहे. या रोलआउटचा विस्तार पुढील पिढीच्या AI साठी आवश्यक असलेल्या प्रचंड पायाभूत सुविधांच्या गरजा अधोरेखित करतो.
अहवालांनुसार, या भागीदारीमध्ये महत्त्वपूर्ण व्यावसायिक वचनबद्धता समाविष्ट आहे; असे म्हटले जात आहे की पहिला टप्पा सुरक्षित करण्यासाठी Microsoft सुरुवातीच्या चिप उत्पादनांपैकी ४० टक्के खरेदीची हमी देण्याची शक्यता आहे. व्हर्टिकल इंटिग्रेशन (vertical integration) आणि हमी दिलेल्या मागणीचा हा स्तर AI क्रांती टिकवून ठेवण्यासाठी आवश्यक असलेल्या उच्च-खर्च आणि उच्च-ऊर्जा पुरवठा साखळीला स्थिर करण्याच्या दिशेने एक मोठे पाऊल आहे.
मुख्य मुद्दे
- कस्टम सिलिकॉन स्ट्रॅटेजी: Jalapeño हे LLM इन्फरन्ससाठी शून्यापासून डिझाइन केलेले एक "Intelligence Processor" आहे, ज्याचे उद्दिष्ट 'परफॉर्मन्स प्रति वॅट' मध्ये जनरल-पर्पज हार्डवेअरपेक्षा सरस कामगिरी करणे आहे.
- जलद विकास: प्रक्रिया वेगवान करण्यासाठी स्वतःच्या AI मॉडेल्सचा वापर करून, OpenAI ने डिझाइनपासून टेप-आउटपर्यंत नऊ महिन्यांचे चक्र पूर्ण केले, जे हाय-परफॉर्मन्स ASICs साठी एक विक्रम आहे.
- मोठ्या प्रमाणावर उपयोजन: Broadcom आणि Microsoft च्या पाठिंब्याने, २०२६ च्या उत्तरार्धात गिगावॅट स्तरावर पहिले मोठे उपयोजन करण्याचे लक्ष्य आहे.
