OpenAI هزینههای استنتاج ChatGPT را برای کاربران مهمان بیش از ۵۰٪ کاهش داد
OpenAI با کاهش بیش از نیمی از هزینههای استنتاج (inference) برای کاربران مهمان ChatGPT، به موفقیت بزرگی در بهرهوری عملیاتی دست یافته است. این کاهش چشمگیر در هزینهی اجرای مدلهای هوش مصنوعی موجود، گامی حیاتی در جهت پایدارتر کردن استقرار هوش مصنوعی در مقیاس بزرگ محسوب میشود.
بهینهسازی تجربه کاربران مهمان
طبق گزارشهای The Information، مهندسان OpenAI با موفقیت بهینهسازیهای جدیدی را بهطور ویژه برای بازدیدکنندگانی که بدون داشتن حساب کاربری از ChatGPT استفاده میکنند، پیادهسازی کردهاند. اگرچه کاربران مهمان در حال حاضر در مقایسه با مشترکین طرحهای Plus یا Team با مجموعه محدودی از ویژگیها در تعامل هستند، اما تأثیر این اقدام بر نیازهای سختافزاری بسیار عمیق است.
بهرهوری فنی حاصل از این بهینهسازیها، تعداد پردازندههای گرافیکی Nvidia مورد نیاز برای پاسخگویی به این کاربران خاص را به تنها چند صد واحد کاهش داده است. اگرچه متدولوژی دقیق بهکاررفته برای دستیابی به این دستاوردها همچنان محرمانه باقی مانده است، اما مقیاس این کاهش نشاندهنده جهشی بزرگ در نحوه مدیریت بارهای کاری سنگینِ استنتاج توسط OpenAI است.
رقابت برای دستیابی به کارایی استنتاج
این تحول در مقطعی حساس برای این صنعت رخ میدهد، چرا که هزینه بالای محاسبات همچنان گلوگاه اصلی در مقیاسپذیری سرویسهای هوش مصنوعی است. OpenAI تنها بازیگری نیست که بر این «مرز کارایی» تمرکز کرده است. اخیراً، DeepSeek روش جدیدی را بهصورت متنباز منتشر کرده است که قادر است سرعت درخواستهای استنتاج را بین ۶۰ تا ۸۵ درصد افزایش دهد.
با تشدید رقابت، تمرکز از صرفاً ساخت مدلهای بزرگتر، به سمت ایجاد روشهای هوشمندتر و مقرونبهصرفهتر برای اجرای آنها تغییر یافته است. برای آزمایشگاههای هوش مصنوعی، هر درصد صرفهجویی در هزینههای استنتاج، مستقیماً به معنای ایجاد «فضای تنفس» است؛ یعنی منابع اضافی که میتوان آنها را صرف آموزش نسل بعدی مدلها، بهبود تأخیر پاسخدهی (latency) یا افزایش حاشیه سود کرد.
تأثیر بر چشمانداز گستردهتر هوش مصنوعی
اگرچه این بهینهسازیها در حال حاضر تنها شامل بخش محدودی از محصول میشود، اما نشاندهنده تغییری گستردهتر در استراتژی هوش مصنوعی است. از آنجایی که توسعه مراکز داده برای همگام شدن با تقاضای تصاعدی برای محاسبات با چالش روبرو است، بهینهسازیهای سطح نرمافزار به اندازه مقیاسپذیری سختافزار حیاتی شدهاند.
اگر OpenAI بتواند این تکنیکهای کاهش هزینه استنتاج را با موفقیت از رابط کاربری مهمان به محصول کامل ChatGPT منتقل کند، میتواند اقتصاد هوش مصنوعی مصرفکننده را بهطور بنیادین تغییر دهد. برای توسعهدهندگان و بنیانگذاران، این موضوع یک روند رو به رشد را برجسته میکند: موفقترین شرکتهای هوش مصنوعی لزوماً آنهایی نخواهند بود که بیشترین پارامتر را دارند، بلکه آنهایی هستند که کارآمدترین خطوط لوله (pipelines) استنتاج را دارا باشند.
نکات کلیدی
- کاهش چشمگیر هزینهها: گزارش شده است که OpenAI از طریق بهینهسازیهای مهندسی جدید، هزینههای استنتاج را برای کاربران بدون حساب کاربری ChatGPT بیش از ۵۰٪ کاهش داده است.
- کارایی سختافزاری: این بهینهسازی، میزان استفاده از پردازندههای گرافیکی Nvidia مورد نیاز برای پاسخگویی به کاربران مهمان را بهشدت کاهش داده و به تنها چند صد واحد رسانده است.
- روند صنعت: از آنجایی که عرضه سختافزار همچنان یک محدودیت محسوب میشود، صنعت در حال چرخش به سمت پیشرفتهای مربوط به سرعت استنتاج است؛ مسیری که با اقدامات مشابه در زمینه کارایی توسط رقبایی مانند DeepSeek همسو است.
