تراشه Jalapeño شرکت OpenAI: چگونه OpenAI هزینه‌های هوش مصنوعی را ۵۰٪ کاهش می‌دهد

OpenAI و Broadcom به‌تازگی از Jalapeño رونمایی کردند. این یک تراشه سفارشی است که تنها برای یک هدف ساخته شده است: اجرای مدل‌های زبانی بزرگ.

این تراشه می‌تواند هزینه‌های استنتاج (inference) را در مقایسه با GPUهای Nvidia تا ۵۰٪ کاهش دهد. نمونه‌های مهندسی در حال حاضر در حال اجرای GPT-5.3-Codex-Spark هستند. تولید انبوه از اواخر سال ۲۰۲۶ آغاز خواهد شد.

OpenAI سالانه حدود ۱۴ میلیارد دلار صرف استنتاج ChatGPT می‌کند. این مبلغ از کل درآمد آن‌ها بیشتر است. کاهش ۵۰ درصدی این هزینه، سالانه ۷ میلیارد دلار برای آن‌ها صرفه‌جویی می‌کند. این اقدام به OpenAI کمک می‌کند تا برای عرضه عمومی اولیه (IPO) احتمالی در سال ۲۰۲۶ آماده شود.

نحوه عملکرد:

بیشتر سخت‌افزارهای هوش مصنوعی از GPUها استفاده می‌کنند. GPUها ابزارهای عمومی هستند؛ آن‌ها گرافیک، آموزش و استنتاج را انجام می‌دهند. این انعطاف‌پذیری باعث ایجاد سربار اضافی می‌شود.

Jalapeño یک ASIC است. این بدان معناست که برای یک وظیفه خاص ساخته شده است. تمرکز آن تنها بر اجرای مدل‌ها پس از آموزش آن‌هاست. این تراشه حافظه و شبکه را کارآمدتر از یک GPU عمومی مدیریت می‌کند.

جزئیات کلیدی:

• از فناوری ۳ نانومتری TSMC استفاده می‌کند. • معماری آن توسط OpenAI طراحی شده است. • پیاده‌سازی سیلیکون توسط Broadcom انجام شده است. • Microsoft ۴۰٪ از اولین سری تولید را خریداری خواهد کرد.

OpenAI از مدل‌های هوش مصنوعی خود برای طراحی این تراشه استفاده کرد. هوش مصنوعی کدها را نوشت و چیدمان‌ها (layouts) را بهینه کرد. این یک چرخه ایجاد می‌کند: هوش مصنوعی به طراحی تراشه‌های بهتر کمک می‌کند و تراشه‌های بهتر، هوش مصنوعی بهتری را اجرا می‌کنند.

این برای شما چه معنایی دارد:

اگر از OpenAI API استفاده می‌کنید، ممکن است این تغییرات را در ۱۲ تا ۱۸ ماه آینده مشاهده کنید:

  • قیمت‌های پایین‌تر API: کاهش هزینه‌ها برای OpenAI، امکان ارائه نرخ‌های ارزان‌تر به توسعه‌دهندگان را فراهم می‌کند.
  • سرعت بالاتر: این تراشه برای مدل‌های transformer تنظیم شده است که باعث کاهش تأخیر (latency) می‌شود.
  • اشتراک‌های ارزان‌تر: قیمت‌های ChatGPT Plus ممکن است کاهش یابد یا شامل ویژگی‌های بیشتری شود.

ریسک‌هایی که باید در نظر گرفت:

  • نبود آزمایش‌های مستقل: بیشتر داده‌ها از خود OpenAI ارائه شده است.
  • استفاده محدود: این تراشه نمی‌تواند مدل‌ها را آموزش دهد. شما همچنان برای آموزش به Nvidia نیاز دارید.
  • وابستگی جدید: OpenAI در حال تغییر وابستگی از Nvidia به Broadcom است.
  • فناوری‌های آینده: اگر ساختار مدل‌های هوش مصنوعی تغییر کند، این تراشه ممکن است ارزش خود را از دست بدهد.

OpenAI دیگر فقط یک آزمایشگاه هوش مصنوعی نیست؛ اکنون یک شرکت زیرساختی است. آن‌ها مدل‌ها، نرم‌افزار و اکنون سخت‌افزار را کنترل می‌کنند.

منبع: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-costs-by-50%

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi