در دل ریاضیات: چگونه تراشه Jalapeño اوپن‌ای‌آی (OpenAI) اقتصاد هوش مصنوعی را هدف قرار می‌دهد

OpenAI با توسعه سیلیکون سفارشی خود، به‌طور تهاجمی در حال حرکت به سمت جدا کردن رشد خود از هزینه‌های سرسام‌آور سخت‌افزارهای شخص ثالث است. تراشه جدید "Jalapeño"، یک مدار مجتمع با کاربرد خاص (ASIC) که با همکاری Broadcom طراحی شده است، نشان‌دهنده یک چرخش استراتژیک به سمت یکپارچگی عمودی برای بهینه‌سازی اقتصاد استنتاج (inference) است.

شکستن وابستگی به انویدیا (Nvidia)

سال‌هاست که صنعت هوش مصنوعی با یک چرخه عظیم هزینه‌های سرمایه‌ای که انویدیا (Nvidia) بر آن تسلط دارد، تعریف شده است. با توجه به اینکه انویدیا در حال حاضر حاشیه سود تخمینی حدود ۷۵٪ را کنترل می‌کند، هزینه آموزش و استقرار مدل‌های مقیاس‌بزرگ به یک گلوگاه قابل توجه برای مقیاس‌پذیری هوش تبدیل شده است. توسعه تراشه Jalapeño توسط OpenAI، پاسخ مستقیمی به این فشار اقتصادی است.

OpenAI با گذار از GPUهای همه‌منظوره به یک ASIC تخصصی، قصد دارد "مالیات" پرداختی به فروشندگان سخت‌افزار را به‌طور قابل توجهی کاهش دهد. برخلاف GPUهای انویدیا که برای طیف گسترده‌ای از وظایف محاسباتی موازی طراحی شده‌اند، تراشه Jalapeño به‌طور خاص برای مدیریت بارهای کاری ریاضی ذاتی در استنتاج LLM معماری شده است. این تخصصی‌سازی اجازه می‌دهد تا کارایی بالاتر، مصرف انرژی کمتر و در نهایت، هزینه کمتر به ازای هر توکن حاصل شود.

همکاری با Broadcom و مزایای ASIC

مشارکت با Broadcom یکی از اجزای حیاتی این استراتژی است. Broadcom در حوزه نیمه‌هادی‌ها یک پیشکسوت است و تخصص فنی لازم برای حرکت از طراحی معماری به سیلیکون فیزیکی را فراهم می‌کند. OpenAI با بهره‌گیری از رویکرد ASIC می‌تواند عملیات ریاضی خاص مورد نیاز مدل‌های خود — مانند ضرب ماتریسی و مکانیزم‌های توجه (attention mechanisms) — را مستقیماً در مدارات سخت‌افزاری بگنجاند.

دستیابی به این سطح از بهینه‌سازی با سخت‌افزارهای همه‌منظوره دشوار است. یک ASIC می‌تواند ویژگی‌های بلااستفاده را حذف کرده و مساحت بیشتری از تراشه (die area) را به واحدهای محاسباتی اختصاص دهد که برای معماری‌های مبتنی بر ترنسفورمر (transformer-based) بیشترین اهمیت را دارند. برای توسعه‌دهندگان و بنیان‌گذاران، این تغییر نشان‌دهنده آینده‌ای است که در آن استقرار مدل‌ها از نظر اقتصادی پایدارتر می‌شود و پتانسیل این را دارد که مدل‌های استدلالی پیچیده‌تر با کسری از هزینه‌های فعلی اجرا شوند.

پیامدها برای چشم‌انداز زیرساخت هوش مصنوعی

ظهور تراشه Jalapeño نشان‌دهنده یک تغییر گسترده‌تر در صنعت هوش مصنوعی است: عصر "طراحی مشترک مدل و سخت‌افزار" (Model-Hardware Co-design). با تخصصی‌تر شدن مدل‌های پیشرو (frontier models)، شکاف بین توانایی‌های سخت‌افزارهای همه‌منظوره و آنچه سیلیکون‌های بهینه‌شده می‌توانند انجام دهند، بیشتر خواهد شد.

اگر OpenAI بتواند این سیلیکون سفارشی را با موفقیت مقیاس‌بندی کند، یک مزیت رقابتی (moat) قدرتمند ایجاد خواهد کرد. این کار نه تنها هزینه مستقیم مقیاس‌پذیری را کاهش می‌دهد، بلکه یک پشته (stack) سخت‌افزاری-نرم‌افزاری اختصاصی فراهم می‌کند که رقبا با تکیه صرف بر تراشه‌های آماده (off-the-shelf) ممکن است در زمینه نسبت قیمت به عملکرد با آن مقابله کنند. این حرکت، کل زنجیره ارزش هوش مصنوعی را مجبور به بازنگری می‌کند و صنعت را به سمت مدلی سوق می‌دهد که در آن موفق‌ترین آزمایشگاه‌های هوش مصنوعی، کارآمدترین معماران سخت‌افزار نیز باشند.

نکات کلیدی

  • کاهش هزینه‌ها: تراشه Jalapeño یک حرکت استراتژیک برای کاهش هزینه‌های سرمایه‌ای عظیم و دور زدن حاشیه سود بالای تامین‌کنندگان سخت‌افزار مانند Nvidia است.
  • معماری تخصصی: این ASIC که با همکاری Broadcom توسعه یافته، به‌طور خاص برای الزامات ریاضی استنتاج LLM بهینه‌سازی شده است، نه محاسبات همه‌منظوره.
  • یکپارچگی عمودی: OpenAI به سمت مدل طراحی مشترک حرکت می‌کند، جایی که سیلیکون سفارشی و نرم‌افزار پیشرفته برای کاهش هزینه هر توکن و فراهم کردن امکان مقیاس‌پذیری عظیم، با هم کار می‌کنند.