OpenAI Jalapeño Chip: OpenAI کس طرح AI اخراجات میں 50% کی کمی لاتا ہے

OpenAI اور Broadcom نے ابھی Jalapeño کا انکشاف کیا ہے۔ یہ ایک ایسا کسٹم چپ ہے جو صرف ایک کام کے لیے بنایا گیا ہے: بڑے لینگویج ماڈلز (large language models) کو چلانا۔

یہ چپ Nvidia GPUs کے مقابلے میں inference اخراجات میں 50% تک کمی کر سکتی ہے۔ انجینئرنگ سیمپلز پہلے ہی GPT-5.3-Codex-Spark چلا رہے ہیں۔ اس کی بڑے پیمانے پر پیداوار (mass production) 2026 کے آخر تک شروع ہو جائے گی۔

OpenAI ہر سال ChatGPT inference پر تقریباً 14 ارب ڈالر خرچ کرتا ہے۔ یہ ان کی کل آمدنی سے بھی زیادہ ہے۔ اس اخراجات میں 50% کی کمی انہیں ہر سال 7 ارب ڈالر بچائے گی۔ یہ قدم OpenAI کو 2026 کے ممکنہ IPO کے لیے تیار کرنے میں مدد دے گا۔

How it works:

زیادہ تر AI ہارڈ ویئر GPUs استعمال کرتے ہیں۔ GPUs عمومی (general) ٹولز ہیں۔ وہ گرافکس، ٹریننگ اور inference کا کام کرتے ہیں۔ یہ لچک اضافی بوجھ (overhead) پیدا کرتی ہے۔

Jalapeño ایک ASIC ہے۔ اس کا مطلب ہے کہ اسے ایک مخصوص کام کے لیے بنایا گیا ہے۔ یہ صرف ماڈلز کی ٹریننگ کے بعد انہیں چلانے پر توجہ مرکوز کرتا ہے۔ یہ ایک عام GPU کے مقابلے میں میموری اور نیٹ ورکنگ کو زیادہ مؤثر طریقے سے سنبھالتا ہے۔

Key details:

• یہ TSMC 3nm ٹیکنالوجی استعمال کرتا ہے۔ • OpenAI نے اس کا آرکیٹیکچر ڈیزائن کیا ہے۔ • Broadcom نے سلیکون امپلیمنٹیشن (silicon implementation) کا کام سنبھالا۔ • Microsoft پہلے بیچ کا 40% خریدے گا۔

OpenAI نے اس چپ کو ڈیزائن کرنے کے لیے اپنے ہی AI ماڈلز کا استعمال کیا۔ AI نے کوڈ لکھا اور لے آؤٹس کو بہتر بنایا۔ یہ ایک چکر (loop) پیدا کرتا ہے: AI بہتر چپ ڈیزائن کرنے میں مدد کرتا ہے، اور بہتر چپس بہتر AI چلاتی ہیں۔

What this means for you:

اگر آپ OpenAI API استعمال کرتے ہیں، تو آپ 12 سے 18 ماہ میں یہ تبدیلیاں دیکھ سکتے ہیں:

  • کم API قیمتیں: OpenAI کے اخراجات میں کمی ڈویلپرز کے لیے سستی شرح ممکن بنائے گی۔
  • تیز رفتار: یہ چپ transformer ماڈلز کے لیے تیار کی گئی ہے، جو لیٹنسی (latency) کو کم کرتی ہے۔
  • سستی سبسکرپشنز: ChatGPT Plus کی قیمتیں کم ہو سکتی ہیں یا اس میں مزید فیچرز شامل کیے جا سکتے ہیں۔

There are risks to consider:

  • کوئی آزادانہ ٹیسٹ نہیں: زیادہ تر ڈیٹا خود OpenAI سے حاصل کیا گیا ہے۔
  • محدود استعمال: یہ چپ ماڈلز کو ٹرین نہیں کر سکتی۔ ٹریننگ کے لیے آپ کو اب بھی Nvidia کی ضرورت ہوگی۔
  • نئی وابستگی: OpenAI اب Nvidia سے Broadcom کی طرف منتقل ہو رہا ہے۔
  • مستقبل کی ٹیکنالوجی: اگر AI ماڈلز اپنا ڈھانچہ تبدیل کرتے ہیں، تو اس چپ کی اہمیت کم ہو سکتی ہے۔

OpenAI اب محض ایک AI لیب نہیں ہے۔ یہ اب ایک انفراسٹرکچر کمپنی ہے۔ وہ ماڈلز، سافٹ ویئر اور اب ہارڈ ویئر کو بھی کنٹرول کرتے ہیں۔

Source: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-costs-by-50%

Optional learning community: https://t.me/GyaanSetuAi