OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

Translated for your language. Read the original.

AI-assisted draft.

OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

In this article

OpenAI اور Broadcom نے Jalapeño سے پردہ اٹھا دیا: LLM Inference کے لیے ایک کسٹم چپ

OpenAI نے "Jalapeño" کے اعلان کے ساتھ کسٹم سلیکون (silicon) کے شعبے میں قدم رکھ کر باضابطہ طور پر سافٹ ویئر سے آگے بڑھنے کا فیصلہ کیا ہے، جو کہ ایک مخصوص Intelligence Processor ہے۔ Broadcom کے ساتھ شراکت داری میں تیار کردہ، یہ کسٹم ایکسلیریٹر (accelerator) بڑے پیمانے پر large language model (LLM) inference کو بہتر بنانے کے لیے ڈیزائن کیا گیا ہے۔

جدید LLMs کے لیے ایک خاص مقصد کے تحت تیار کردہ آرکیٹیکچر

موجودہ بہت سے حل جو تبدیل شدہ general-purpose GPUs پر انحصار کرتے ہیں، ان کے برعکس Jalapeño ایک ایسا ڈیزائن ہے جسے خاص طور پر LLM inference کی منفرد ضروریات کے لیے شروع سے تیار کیا گیا ہے۔ اس کا مقصد جدید AI کے بنیادی مسائل کو حل کرنا ہے: ڈیٹا کی نقل (data movement) اور ہارڈ ویئر کا کم استعمال (underutilization)۔ آرکیٹیکچر کو اس طرح بہتر بنا کر کہ اس کا استعمال اس کی نظریاتی حد (theoretical maximum) کے قریب ہو سکے، OpenAI کا مقصد موجودہ جدید ترین ہارڈ ویئر کے مقابلے میں 'performance per watt' کو نمایاں طور پر بہتر بنانا ہے۔

اگرچہ OpenAI نے ابھی تک کوئی حتمی تکنیکی رپورٹ یا آزادانہ بینچ مارکس جاری نہیں کیے ہیں، لیکن ابتدائی اندرونی ٹیسٹ کارکردگی میں خاطر خواہ بہتری کی نشاندہی کرتے ہیں۔ انجینئرنگ سیمپلز کا استعمال لیبارٹری کے ماحول میں پیچیدہ مشین لرننگ ورک لوڈز چلانے کے لیے کیا جا رہا ہے، جن میں GPT-5.3-Codex-Spark ماڈل بھی شامل ہے—ایک ایسا ماڈل جو فی الحال اپنی inference ضروریات کے لیے Cerebras ہارڈ ویئر پر انحصار کرتا ہے۔

متعدد کمپنیوں کا ایک طاقتور اشتراک

Jalapeño کی تیاری ایک پیچیدہ کثیر الجہتی کوشش ہے جو پورے ہارڈ ویئر اسٹیک (hardware stack) پر محیط ہے۔ OpenAI چپ ڈیزائن کی قیادت کرتا ہے، اور ترقی کے عمل کو تیز کرنے کے لیے اپنے خود کے AI ماڈلز کا استعمال کرتا ہے، جس کے بارے میں بتایا گیا ہے کہ ڈیزائن سے لے کر tape-out تک صرف نو ماہ لگے۔ Broadcom اہم سلیکون مینوفیکچرنگ مہارت اور جدید نیٹ ورکنگ ٹیکنالوجی فراہم کرتا ہے، جس میں اس کے اعلیٰ کارکردگی والے Tomahawk نیٹ ورکنگ چپس بھی شامل ہیں۔ اس ماحولیاتی نظام (ecosystem) کو مکمل کرتے ہوئے، Celestica بورڈز، ریکس (racks) اور مکمل سسٹم انٹیگریشن کا ذمہ دار ہے۔

یہ تعاون OpenAI کے لیے ایک اسٹریٹجک تبدیلی کی نمائندگی کرتا ہے، جو صرف ماڈلز اور مصنوعات پر توجہ مرکوز کرنے والی کمپنی سے ہٹ کر اب ایک ایسی کمپنی بن رہی ہے جو بنیادی ہارڈ ویئر اسٹیک کو کنٹرول کرتی ہے۔ سلیکون کا مالک ہونے کی وجہ سے، OpenAI نظریاتی طور پر اپنے ماڈلز کو تیسرے فریق (third-party) فراہم کنندگان پر انحصار کرنے والے حریفوں کے مقابلے میں زیادہ تیزی سے، زیادہ قابل اعتماد طریقے سے اور بہت کم لاگت پر چلا سکتا ہے۔

2026 تک گگاوٹ (Gigawatt) سطح تک توسیع

Jalapeño کا روڈ میپ انتہائی پرجوش ہے۔ Broadcom کے CEO Hock Tan نے اشارہ دیا ہے کہ پہلی تعیناتی (deployment) کا منصوبہ 2026 کے آخر کے لیے ہے، جس کا مقصد Microsoft اور دیگر اسٹریٹجک شراکت داروں کے ساتھ گگاوٹ پیمانے پر کام کرنا ہے۔ اس کی توسیع کا پیمانہ اگلی نسل کے AI کے لیے بڑے پیمانے پر بنیادی ڈھانچے (infrastructure) کی ضروریات کو اجاگر کرتا ہے۔

رپورٹوں سے پتہ چلتا ہے کہ اس شراکت داری میں اہم تجارتی وعدے شامل ہیں، جس کے مطابق Microsoft سے توقع کی جا رہی ہے کہ وہ پہلے مرحلے کو محفوظ بنانے کے لیے ابتدائی چپ پیداوار کے 40 فیصد کی خریداری کی ضمانت دے گا۔ ورٹیکل انٹیگریشن (vertical integration) اور یقینی طلب کی یہ سطح AI انقلاب کو برقرار رکھنے کے لیے درکار اعلیٰ لاگت اور اعلیٰ توانائی والی سپلائی چین کو مستحکم کرنے کی طرف ایک بڑا قدم ہے۔

اہم نکات

کسٹم سلیکون حکمت عملی: Jalapeño ایک "Intelligence Processor" ہے جسے LLM inference کے لیے شروع سے ڈیزائن کیا گیا ہے، جس کا مقصد 'performance per watt' میں general-purpose ہارڈ ویئر سے بہتر کارکردگی دکھانا ہے۔
تیز رفتار ترقی: عمل کو تیز کرنے کے لیے اپنے خود کے AI ماڈلز کا استعمال کرتے ہوئے، OpenAI نے ڈیزائن سے tape-out تک نو ماہ کا سائیکل مکمل کیا، جو کہ اعلیٰ کارکردگی والے ASICs کے لیے ایک ریکارڈ ہے۔
بڑے پیمانے پر تعیناتی: پہلی بڑے پیمانے پر تعیناتی کا ہدف 2026 کے آخر میں گگاوٹ پیمانے پر ہے، جس میں Broadcom اور Microsoft کا تعاون حاصل ہوگا۔

OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

OpenAI اور Broadcom نے Jalapeño سے پردہ اٹھا دیا: LLM Inference کے لیے ایک کسٹم چپ

جدید LLMs کے لیے ایک خاص مقصد کے تحت تیار کردہ آرکیٹیکچر

متعدد کمپنیوں کا ایک طاقتور اشتراک

2026 تک گگاوٹ (Gigawatt) سطح تک توسیع

اہم نکات

Continue reading

OpenAI نے Jalapeño متعارف کروا دیا: اس کا پہلا کسٹم اے آئی انفرنس چپ

OpenAI نے Jalapeño متعارف کروا دیا: اس کا پہلا کسٹم اے آئی انفرنس چپ

ریاضی کی گہرائی میں: کیسے OpenAI کا Jalapeño چپ AI کی معیشت کو نشانہ بناتا ہے

OpenAI کا جلیپینو چپ: Nvidia کے غلبے سے دور ہونے کے لیے ایک اسٹریٹجک تبدیلی

OpenAI Jalapeño Chip: How OpenAI Slashes AI Costs by 50%