விருந்தினர் பயனர்களுக்கான ChatGPT இன்ஃபரன்ஸ் செலவுகளை OpenAI 50%-க்கும் அதிகமாகக் குறைத்துள்ளது

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 நாட்களுக்கு முன்2min read

விருந்தினர் பயனர்களுக்கான ChatGPT இன்ஃபரன்ஸ் செலவுகளை OpenAI 50%-க்கும் அதிகமாகக் குறைத்துள்ளது

In this article

OpenAI, விருந்தினர் பயனர்களுக்கான (Guest Users) ChatGPT Inference செலவுகளை 50%-க்கும் மேலாகக் குறைத்துள்ளது

ChatGPT விருந்தினர் பயனர்களுக்கான inference செலவுகளை பாதியைக் குறைப்பதன் மூலம், செயல்பாட்டுத் திறனில் (operational efficiency) OpenAI ஒரு மிகப்பெரிய முன்னேற்றத்தை எட்டியுள்ளது. தற்போதுள்ள AI மாடல்களை இயக்குவதற்கான செலவில் ஏற்பட்டுள்ள இந்த குறிப்பிடத்தக்கக் குறைவு, பெரிய அளவிலான AI பயன்பாடுகளை (AI deployment) மிகவும் நிலையானதாக மாற்றுவதில் ஒரு முக்கியமான படியாகும்.

விருந்தினர் அனுபவத்தை மேம்படுத்துதல்

The Information அறிக்கையின்படி, கணக்கு (account) இல்லாமல் ChatGPT-ஐப் பயன்படுத்தும் பார்வையாளர்களைக் குறிவைத்து, OpenAI பொறியாளர்கள் புதிய மேம்பாடுகளை (optimizations) வெற்றிகரமாகச் செயல்படுத்தியுள்ளனர். Plus அல்லது Team சந்தாதாரர்களுடன் ஒப்பிடும்போது, விருந்தினர் பயனர்கள் தற்போது வரையறுக்கப்பட்ட அம்சங்களையே பயன்படுத்துகின்றனர் என்றாலும், வன்பொருள் தேவைகளில் (hardware requirements) ஏற்பட்டுள்ள தாக்கம் மிக அதிகம்.

இந்த மேம்பாடுகள் மூலம் பெறப்பட்ட தொழில்நுட்பத் திறன், இத்தகைய பயனர்களுக்குச் சேவை செய்யத் தேவையான Nvidia GPU-க்களின் எண்ணிக்கையை வெறும் சில நூறுகளாகக் குறைத்துள்ளது. இந்த முன்னேற்றத்தை அடையப் பயன்படுத்தப்பட்ட துல்லியமான முறை ரகசியமாக (proprietary) இருந்தாலும், இந்தச் செலவுக் குறைப்பின் அளவு, OpenAI தனது கணக்கீட்டுத் திறன் சார்ந்த (compute-heavy) inference பணிகளை எவ்வாறு நிர்வகிக்கிறது என்பதில் ஒரு பெரிய முன்னேற்றத்தைக் காட்டுகிறது.

Inference திறனுக்கானப் போட்டி

AI சேவைகளை விரிவுபடுத்துவதில் கணக்கீட்டுச் செலவு (compute cost) ஒரு முக்கியத் தடையாக இருப்பதால், இந்தத் துறைக்கு இக்காலகட்டம் மிகவும் முக்கியமானது. இந்த "திறன் எல்லையில்" (efficiency frontier) கவனம் செலுத்தும் ஒரே நிறுவனம் OpenAI மட்டுமல்ல. சமீபத்தில், DeepSeek நிறுவனம் inference கோரிக்கைகளை 60% முதல் 85% வரை வேகப்படுத்தக்கூடிய ஒரு புதிய திறந்த மூல (open-source) முறையை வெளியிட்டுள்ளது.

போட்டி தீவிரமடைந்து வரும் நிலையில், வெறும் பெரிய மாடல்களை உருவாக்குவதிலிருந்து, அவற்றை இயக்குவதற்கான புத்திசாலித்தனமான மற்றும் செலவு குறைந்த வழிகளைக் கண்டறிவதில் கவனம் திரும்பியுள்ளது. AI ஆய்வகங்களைப் பொறுத்தவரை, inference செலவில் சேமிக்கப்படும் ஒவ்வொரு சதவீதமும் அவர்களுக்கு "சுவாச இடைவெளியை" (breathing room) வழங்குகிறது—அதாவது, அடுத்த தலைமுறை மாடல்களைப் பயிற்றுவிப்பதற்கும், பதிலளிக்கும் வேகத்தை (response latency) மேம்படுத்துவதற்கும் அல்லது லாப வரம்புகளை அதிகரிப்பதற்கும் பயன்படுத்தக்கூடிய கூடுதல் ஆதாரங்கள் கிடைக்கும்.

பரந்த AI சூழலில் ஏற்படும் தாக்கம்

இந்த மேம்பாடுகள் தற்போது தயாரிப்பின் ஒரு குறிப்பிட்ட பகுதிக்கு மட்டுமே பொருந்தினாலும், அவை AI உத்தியில் (AI strategy) ஏற்பட்டுள்ள ஒரு பெரிய மாற்றத்தைக் குறிக்கின்றன. கணக்கீட்டுத் தேவைகளுக்கான (compute demand) அபரிமிதமான வளர்ச்சியுடன் தரவு மையங்களை (data centers) உருவாக்குவது சவாலாக இருக்கும் நிலையில், மென்பொருள் மட்டத்திலான மேம்பாடுகள் (software-level optimizations) வன்பொருள் விரிவாக்கத்தைப் போலவே இன்றியமையாததாகி வருகின்றன.

OpenAI இந்த inference-சேமிப்பு நுட்பங்களை விருந்தினர் இடைமுகத்திலிருந்து (guest interface) முழுமையான ChatGPT தயாரிப்பிற்கு வெற்றிகரமாக மாற்றினால், அது நுகர்வோர் AI-ன் பொருளாதாரத்தையே அடிப்படை ரீதியாக மாற்றக்கூடும். டெவலப்பர்கள் மற்றும் நிறுவனர்களுக்கு, இது ஒரு வளர்ந்து வரும் போக்கைக் காட்டுகிறது: அதிக அளவு அளவுருக்களைக் (parameters) கொண்ட நிறுவனங்கள் மட்டுமல்லாமல், மிகவும் திறமையான inference வழிமுறைகளைக் (inference pipelines) கொண்ட நிறுவனங்களே மிகவும் வெற்றிகரமான AI நிறுவனங்களாக இருக்கும்.

முக்கியக் குறிப்புகள்

பெரிய அளவிலான செலவுக் குறைப்பு: புதிய பொறியியல் மேம்பாடுகள் மூலம், கணக்கு இல்லாத ChatGPT பயனர்களுக்கான inference செலவுகளை OpenAI 50%-க்கும் மேலாகக் குறைத்துள்ளதாகத் தெரிவிக்கப்பட்டுள்ளது.
வன்பொருள் திறன்: இந்த மேம்பாடு, விருந்தினர் பயனர்களுக்குச் சேவை செய்யத் தேவையான Nvidia GPU-க்களின் எண்ணிக்கையை வெறும் சில நூறு அலகுகளாகக் கணிசமாகக் குறைத்துள்ளது.
தொழில்துறைப் போக்கு: வன்பொருள் விநியோகம் ஒரு தடையாக இருக்கும் நிலையில், DeepSeek போன்ற போட்டியாளர்களின் இதேபோன்ற திறன் மேம்பாட்டு நடவடிக்கைகளைப் பின்பற்றி, இந்தத் துறை inference-வேக முன்னேற்றங்களை நோக்கித் திரும்புகிறது.

விருந்தினர் பயனர்களுக்கான ChatGPT இன்ஃபரன்ஸ் செலவுகளை OpenAI 50%-க்கும் அதிகமாகக் குறைத்துள்ளது

OpenAI, விருந்தினர் பயனர்களுக்கான (Guest Users) ChatGPT Inference செலவுகளை 50%-க்கும் மேலாகக் குறைத்துள்ளது

விருந்தினர் அனுபவத்தை மேம்படுத்துதல்

Inference திறனுக்கானப் போட்டி

பரந்த AI சூழலில் ஏற்படும் தாக்கம்

முக்கியக் குறிப்புகள்

Continue reading

புதிய சுகாதாரத் தரநிலையில் மருத்துவர்களை விடச் சிறப்பாகச் செயல்படும் OpenAI-ன் GPT 5.5 Instant

ChatGPT-ஐ ஒரு AI உதவியாளராக மாற்ற OpenAI திட்டமிடப்பட்ட பணி கட்டுப்பாடுகளை அறிமுகப்படுத்துகிறது

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI Jalapeño சிப்: OpenAI எவ்வாறு AI செலவுகளை 50% குறைக்கிறது?