OpenAI هزینه‌های استنتاج ChatGPT را برای کاربران مهمان بیش از ۵۰٪ کاهش داد

OpenAI با کاهش بیش از نیمی از هزینه‌های استنتاج (inference) برای کاربران مهمان ChatGPT، به موفقیت بزرگی در بهره‌وری عملیاتی دست یافته است. این کاهش چشمگیر در هزینه‌ی اجرای مدل‌های هوش مصنوعی موجود، گامی حیاتی در جهت پایدارتر کردن استقرار هوش مصنوعی در مقیاس بزرگ محسوب می‌شود.

بهینه‌سازی تجربه کاربران مهمان

طبق گزارش‌های The Information، مهندسان OpenAI با موفقیت بهینه‌سازی‌های جدیدی را به‌طور ویژه برای بازدیدکنندگانی که بدون داشتن حساب کاربری از ChatGPT استفاده می‌کنند، پیاده‌سازی کرده‌اند. اگرچه کاربران مهمان در حال حاضر در مقایسه با مشترکین طرح‌های Plus یا Team با مجموعه محدودی از ویژگی‌ها در تعامل هستند، اما تأثیر این اقدام بر نیازهای سخت‌افزاری بسیار عمیق است.

بهره‌وری فنی حاصل از این بهینه‌سازی‌ها، تعداد پردازنده‌های گرافیکی Nvidia مورد نیاز برای پاسخگویی به این کاربران خاص را به تنها چند صد واحد کاهش داده است. اگرچه متدولوژی دقیق به‌کاررفته برای دستیابی به این دستاوردها همچنان محرمانه باقی مانده است، اما مقیاس این کاهش نشان‌دهنده جهشی بزرگ در نحوه مدیریت بارهای کاری سنگینِ استنتاج توسط OpenAI است.

رقابت برای دستیابی به کارایی استنتاج

این تحول در مقطعی حساس برای این صنعت رخ می‌دهد، چرا که هزینه بالای محاسبات همچنان گلوگاه اصلی در مقیاس‌پذیری سرویس‌های هوش مصنوعی است. OpenAI تنها بازیگری نیست که بر این «مرز کارایی» تمرکز کرده است. اخیراً، DeepSeek روش جدیدی را به‌صورت متن‌باز منتشر کرده است که قادر است سرعت درخواست‌های استنتاج را بین ۶۰ تا ۸۵ درصد افزایش دهد.

با تشدید رقابت، تمرکز از صرفاً ساخت مدل‌های بزرگ‌تر، به سمت ایجاد روش‌های هوشمندتر و مقرون‌به‌صرفه‌تر برای اجرای آن‌ها تغییر یافته است. برای آزمایشگاه‌های هوش مصنوعی، هر درصد صرفه‌جویی در هزینه‌های استنتاج، مستقیماً به معنای ایجاد «فضای تنفس» است؛ یعنی منابع اضافی که می‌توان آن‌ها را صرف آموزش نسل بعدی مدل‌ها، بهبود تأخیر پاسخ‌دهی (latency) یا افزایش حاشیه سود کرد.

تأثیر بر چشم‌انداز گسترده‌تر هوش مصنوعی

اگرچه این بهینه‌سازی‌ها در حال حاضر تنها شامل بخش محدودی از محصول می‌شود، اما نشان‌دهنده تغییری گسترده‌تر در استراتژی هوش مصنوعی است. از آنجایی که توسعه مراکز داده برای همگام شدن با تقاضای تصاعدی برای محاسبات با چالش روبرو است، بهینه‌سازی‌های سطح نرم‌افزار به اندازه مقیاس‌پذیری سخت‌افزار حیاتی شده‌اند.

اگر OpenAI بتواند این تکنیک‌های کاهش هزینه استنتاج را با موفقیت از رابط کاربری مهمان به محصول کامل ChatGPT منتقل کند، می‌تواند اقتصاد هوش مصنوعی مصرف‌کننده را به‌طور بنیادین تغییر دهد. برای توسعه‌دهندگان و بنیان‌گذاران، این موضوع یک روند رو به رشد را برجسته می‌کند: موفق‌ترین شرکت‌های هوش مصنوعی لزوماً آن‌هایی نخواهند بود که بیشترین پارامتر را دارند، بلکه آن‌هایی هستند که کارآمدترین خطوط لوله (pipelines) استنتاج را دارا باشند.

نکات کلیدی

  • کاهش چشمگیر هزینه‌ها: گزارش شده است که OpenAI از طریق بهینه‌سازی‌های مهندسی جدید، هزینه‌های استنتاج را برای کاربران بدون حساب کاربری ChatGPT بیش از ۵۰٪ کاهش داده است.
  • کارایی سخت‌افزاری: این بهینه‌سازی، میزان استفاده از پردازنده‌های گرافیکی Nvidia مورد نیاز برای پاسخگویی به کاربران مهمان را به‌شدت کاهش داده و به تنها چند صد واحد رسانده است.
  • روند صنعت: از آنجایی که عرضه سخت‌افزار همچنان یک محدودیت محسوب می‌شود، صنعت در حال چرخش به سمت پیشرفت‌های مربوط به سرعت استنتاج است؛ مسیری که با اقدامات مشابه در زمینه کارایی توسط رقبایی مانند DeepSeek همسو است.