OpenAI, விருந்தினர் பயனர்களுக்கான (Guest Users) ChatGPT Inference செலவுகளை 50%-க்கும் மேலாகக் குறைத்துள்ளது

ChatGPT விருந்தினர் பயனர்களுக்கான inference செலவுகளை பாதியைக் குறைப்பதன் மூலம், செயல்பாட்டுத் திறனில் (operational efficiency) OpenAI ஒரு மிகப்பெரிய முன்னேற்றத்தை எட்டியுள்ளது. தற்போதுள்ள AI மாடல்களை இயக்குவதற்கான செலவில் ஏற்பட்டுள்ள இந்த குறிப்பிடத்தக்கக் குறைவு, பெரிய அளவிலான AI பயன்பாடுகளை (AI deployment) மிகவும் நிலையானதாக மாற்றுவதில் ஒரு முக்கியமான படியாகும்.

விருந்தினர் அனுபவத்தை மேம்படுத்துதல்

The Information அறிக்கையின்படி, கணக்கு (account) இல்லாமல் ChatGPT-ஐப் பயன்படுத்தும் பார்வையாளர்களைக் குறிவைத்து, OpenAI பொறியாளர்கள் புதிய மேம்பாடுகளை (optimizations) வெற்றிகரமாகச் செயல்படுத்தியுள்ளனர். Plus அல்லது Team சந்தாதாரர்களுடன் ஒப்பிடும்போது, விருந்தினர் பயனர்கள் தற்போது வரையறுக்கப்பட்ட அம்சங்களையே பயன்படுத்துகின்றனர் என்றாலும், வன்பொருள் தேவைகளில் (hardware requirements) ஏற்பட்டுள்ள தாக்கம் மிக அதிகம்.

இந்த மேம்பாடுகள் மூலம் பெறப்பட்ட தொழில்நுட்பத் திறன், இத்தகைய பயனர்களுக்குச் சேவை செய்யத் தேவையான Nvidia GPU-க்களின் எண்ணிக்கையை வெறும் சில நூறுகளாகக் குறைத்துள்ளது. இந்த முன்னேற்றத்தை அடையப் பயன்படுத்தப்பட்ட துல்லியமான முறை ரகசியமாக (proprietary) இருந்தாலும், இந்தச் செலவுக் குறைப்பின் அளவு, OpenAI தனது கணக்கீட்டுத் திறன் சார்ந்த (compute-heavy) inference பணிகளை எவ்வாறு நிர்வகிக்கிறது என்பதில் ஒரு பெரிய முன்னேற்றத்தைக் காட்டுகிறது.

Inference திறனுக்கானப் போட்டி

AI சேவைகளை விரிவுபடுத்துவதில் கணக்கீட்டுச் செலவு (compute cost) ஒரு முக்கியத் தடையாக இருப்பதால், இந்தத் துறைக்கு இக்காலகட்டம் மிகவும் முக்கியமானது. இந்த "திறன் எல்லையில்" (efficiency frontier) கவனம் செலுத்தும் ஒரே நிறுவனம் OpenAI மட்டுமல்ல. சமீபத்தில், DeepSeek நிறுவனம் inference கோரிக்கைகளை 60% முதல் 85% வரை வேகப்படுத்தக்கூடிய ஒரு புதிய திறந்த மூல (open-source) முறையை வெளியிட்டுள்ளது.

போட்டி தீவிரமடைந்து வரும் நிலையில், வெறும் பெரிய மாடல்களை உருவாக்குவதிலிருந்து, அவற்றை இயக்குவதற்கான புத்திசாலித்தனமான மற்றும் செலவு குறைந்த வழிகளைக் கண்டறிவதில் கவனம் திரும்பியுள்ளது. AI ஆய்வகங்களைப் பொறுத்தவரை, inference செலவில் சேமிக்கப்படும் ஒவ்வொரு சதவீதமும் அவர்களுக்கு "சுவாச இடைவெளியை" (breathing room) வழங்குகிறது—அதாவது, அடுத்த தலைமுறை மாடல்களைப் பயிற்றுவிப்பதற்கும், பதிலளிக்கும் வேகத்தை (response latency) மேம்படுத்துவதற்கும் அல்லது லாப வரம்புகளை அதிகரிப்பதற்கும் பயன்படுத்தக்கூடிய கூடுதல் ஆதாரங்கள் கிடைக்கும்.

பரந்த AI சூழலில் ஏற்படும் தாக்கம்

இந்த மேம்பாடுகள் தற்போது தயாரிப்பின் ஒரு குறிப்பிட்ட பகுதிக்கு மட்டுமே பொருந்தினாலும், அவை AI உத்தியில் (AI strategy) ஏற்பட்டுள்ள ஒரு பெரிய மாற்றத்தைக் குறிக்கின்றன. கணக்கீட்டுத் தேவைகளுக்கான (compute demand) அபரிமிதமான வளர்ச்சியுடன் தரவு மையங்களை (data centers) உருவாக்குவது சவாலாக இருக்கும் நிலையில், மென்பொருள் மட்டத்திலான மேம்பாடுகள் (software-level optimizations) வன்பொருள் விரிவாக்கத்தைப் போலவே இன்றியமையாததாகி வருகின்றன.

OpenAI இந்த inference-சேமிப்பு நுட்பங்களை விருந்தினர் இடைமுகத்திலிருந்து (guest interface) முழுமையான ChatGPT தயாரிப்பிற்கு வெற்றிகரமாக மாற்றினால், அது நுகர்வோர் AI-ன் பொருளாதாரத்தையே அடிப்படை ரீதியாக மாற்றக்கூடும். டெவலப்பர்கள் மற்றும் நிறுவனர்களுக்கு, இது ஒரு வளர்ந்து வரும் போக்கைக் காட்டுகிறது: அதிக அளவு அளவுருக்களைக் (parameters) கொண்ட நிறுவனங்கள் மட்டுமல்லாமல், மிகவும் திறமையான inference வழிமுறைகளைக் (inference pipelines) கொண்ட நிறுவனங்களே மிகவும் வெற்றிகரமான AI நிறுவனங்களாக இருக்கும்.

முக்கியக் குறிப்புகள்

  • பெரிய அளவிலான செலவுக் குறைப்பு: புதிய பொறியியல் மேம்பாடுகள் மூலம், கணக்கு இல்லாத ChatGPT பயனர்களுக்கான inference செலவுகளை OpenAI 50%-க்கும் மேலாகக் குறைத்துள்ளதாகத் தெரிவிக்கப்பட்டுள்ளது.
  • வன்பொருள் திறன்: இந்த மேம்பாடு, விருந்தினர் பயனர்களுக்குச் சேவை செய்யத் தேவையான Nvidia GPU-க்களின் எண்ணிக்கையை வெறும் சில நூறு அலகுகளாகக் கணிசமாகக் குறைத்துள்ளது.
  • தொழில்துறைப் போக்கு: வன்பொருள் விநியோகம் ஒரு தடையாக இருக்கும் நிலையில், DeepSeek போன்ற போட்டியாளர்களின் இதேபோன்ற திறன் மேம்பாட்டு நடவடிக்கைகளைப் பின்பற்றி, இந்தத் துறை inference-வேக முன்னேற்றங்களை நோக்கித் திரும்புகிறது.