OpenAI از Jalapeño رونمایی کرد: اولین تراشه اختصاصی استنتاج هوش مصنوعی خود

OpenAI با معرفی Jalapeño، یک پردازنده هوشمند با طراحی اختصاصی که با همکاری Broadcom ساخته شده است، رسماً وارد رقابت تولید تراشه شد. این حرکت استراتژیک نشان‌دهنده تغییری بزرگ در نحوه مقیاس‌پذیری زیرساخت‌های این غول هوش مصنوعی و مدیریت نیازهای محاسباتی عظیم مدل‌های زبانی بزرگ در آینده است.

فراتر از Nvidia: ظهور ASIC

سال‌هاست که صنعت هوش مصنوعی به GPUهای با کارایی بالای Nvidia وابسته بوده است. با این حال، OpenAI اکنون با Jalapeño که یک مدار مجتمع با کاربرد خاص (ASIC) است، به سمت رویکردی تخصصی تغییر مسیر داده است. برخلاف GPUهای همه‌منظوره، این ASIC به‌طور ویژه برای استنتاج (inference) هوش مصنوعی ساخته شده است؛ مرحله‌ای حیاتی که در آن مدلی مانند ChatGPT یا Codex، درخواست کاربر را برای تولید یک پاسخ آنی پردازش می‌کند.

OpenAI با طراحی سخت‌افزار به‌طور اختصاصی برای استنتاج، قصد دارد کارایی اجرای مدل‌های فعلی خود را بهینه کند. این اقدام در ادامه همکاری با Broadcom است که تنها ۹ ماه پیش اعلام شد و هدف آن کاهش وابستگی شدید OpenAI به سخت‌افزارهای Nvidia با محدودیت عرضه بود.

برابری با غول‌های صنعت از نظر عملکرد

جاه‌طلبی‌های فنی برای Jalapeño قابل توجه است. هاک تان (Hock Tan)، مدیرعامل Broadcom، اعلام کرده است که این تراشه برای برابری با استانداردهای عملکردی صنعت، به‌ویژه معماری Blackwell شرکت Nvidia و واحدهای پردازش تنسور (TPU) گوگل، طراحی شده است.

در حالی که رقبایی مانند Microsoft، Meta و Amazon نیز تراشه‌های اختصاصی خود را برای تامین توان مراکز داده‌شان عرضه کرده‌اند، OpenAI بر یک معیار حیاتی تمرکز کرده است: کارایی (efficiency). آزمایش‌های اولیه نشان می‌دهد که Jalapeño قابلیت‌های «عملکرد به ازای وات» (performance-per-watt) را ارائه می‌دهد که به‌طور قابل توجهی بهتر از راهکارهای پیشرفته فعلی است. در دنیای استقرار هوش مصنوعی در مقیاس عظیم، جایی که هزینه‌های برق و مدیریت حرارتی گلوگاه‌های اصلی هستند، این مزیتِ کارایی می‌تواند یک برتری رقابتی تعیین‌کننده باشد.

یک استراتژی محاسباتی چندنسلی

OpenAI به Jalapeño به عنوان یک محصول سخت‌افزاری تک‌باره نگاه نمی‌کند. در عوض، این شرکت آن را به عنوان «اولین قدم در یک پلتفرم محاسباتی چندنسلی» توصیف می‌کند. این امر نشان‌دهنده یک نقشه راه بلندمدت برای ساخت یک پشته (stack) یکپارچه عمودی است که در آن نرم‌افزار (LLMها) و سخت‌افزار (ASICها) برای دستیابی به حداکثر هم‌افزایی، به‌صورت مشترک طراحی می‌شوند.

این شرکت انتظار دارد استقرار این پلتفرم محاسباتی جدید را تا پایان سال ۲۰۲۶ آغاز کند. با افزایش پیچیدگی مدل‌ها و رایج‌تر شدن جریان‌های کاری مبتنی بر عامل (agentic workflows)، داشتن تراشه‌های اختصاصی به OpenAI اجازه می‌دهد تا تأخیر (latency) را کاهش داده و هزینه‌های سرسام‌آور مرتبط با اجرای هوش مصنوعی در سطح پیشرو (frontier-level) را در مقیاس بزرگ، پایین بیاورد.

چرا این موضوع برای اکوسیستم هوش مصنوعی اهمیت دارد

ورود OpenAI به حوزه طراحی تراشه، نشان‌دهنده بلوغ صنعت هوش مصنوعی است. ما از مرحله «مصرف بی‌قید و بند سخت‌افزار» به سمت «بهینه‌سازی سخت‌افزار تخصصی» حرکت می‌کنیم. با افزایش چشمگیر تقاضا برای استنتاج همزمان با ظهور عامل‌های هوش مصنوعی، توانایی کنترل تراشه‌های زیرساختی تعیین خواهد کرد که کدام شرکت‌ها می‌توانند به‌طور پایدار مقیاس‌پذیر شوند و کدام شرکت‌ها همچنان وابسته به زنجیره تأمین GPU باقی خواهند ماند.

نکات کلیدی

  • تمرکز تخصصی: Jalapeño یک ASIC است که به‌طور ویژه برای استنتاج هوش مصنوعی طراحی شده و سرعت و هزینه اجرای مدل‌هایی مانند ChatGPT را بهینه می‌کند.
  • استانداردهای عملکردی: این تراشه که با همکاری Broadcom توسعه یافته، هدفش رقابت با Blackwell شرکت Nvidia و TPUهای گوگل از نظر عملکرد و در عین حال ارائه عملکرد به ازای واتِ برتر است.
  • نقشه راه بلندمدت: انتظار می‌رود Jalapeño تا اواخر سال ۲۰۲۶ مستقر شود؛ این تراشه پایه و اساس یک پلتفرم سخت‌افزاری چندنسلی برای کاهش وابستگی به GPUهای شخص ثالث است.