OpenAI Jalapeño-வை அறிமுகப்படுத்துகிறது: அதன் முதல் பிரத்யேக AI Inference சிப்
Broadcom உடன் இணைந்து உருவாக்கப்பட்ட அதன் முதல் பிரத்யேக inference processor ஆன Jalapeño-வை அறிவிப்பதன் மூலம், OpenAI அதிகாரப்பூர்வமாக சிலிக்கான் போட்டியில் நுழைந்துள்ளது. இந்த மூலோபாய நகர்வு, OpenAI-யின் உள்கட்டமைப்பு உத்தியில் ஒரு குறிப்பிடத்தக்க மாற்றத்தைக் குறிக்கிறது, இது அதன் பிரம்மாண்டமான மாடல்களை பயனர்களுக்கு வழங்கும் முறையை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது.
Nvidia GPUs மீதான சார்புநிலையை உடைத்தல்
பல ஆண்டுகளாக, AI தொழில் துறை Nvidia-வின் உயர்தர GPUs-ஐ பெரிதும் நம்பியிருந்தது. இருப்பினும், குறிப்பிட்ட machine learning வேலைப்பளுக்களைக் கையாளுவதற்காக வடிவமைக்கப்பட்ட சிறப்பு சிலிக்கான் எனப்படும் தனது சொந்த "AI accelerators"-களை உருவாக்குவதன் மூலம், OpenAI நிறுவனம் Google மற்றும் Amazon போன்ற தொழில்நுட்ப ஜாம்பவான்களின் வரிசையில் இணைந்துள்ளது. frontier மாடல்களைப் பயிற்சியளிப்பதற்கு (pre-training)த் தேவையான பிரம்மாண்டமான கணக்கீட்டுத் திறனுக்கு Nvidia ஒரு தரநிலையாகத் தொடர்ந்தாலும், OpenAI அடுத்த முக்கியமான தடையை இலக்கு வைக்கிறது: அதுதான் inference.
Jalapeño குறிப்பாக inference-க்காக வடிவமைக்கப்பட்டுள்ளது; அதாவது, ஒரு பயிற்சியளிக்கப்பட்ட மாடல் பயனரின் கட்டளைகளைச் செயலாக்கி வெளியீடுகளை உருவாக்கும் நிலை இதுவாகும். இந்த குறிப்பிட்ட கட்டத்தில் கவனம் செலுத்துவதன் மூலம், பொதுவான வன்பொருள்களின் (general-purpose hardware) மீதான தனது சார்பைக் குறைக்கவும், தனது செயல்பாட்டுச் செலவுகளைத் துல்லியமாகக் கட்டுப்படுத்தவும் OpenAI இலக்கு வைத்துள்ளது.
Performance-per-Watt மற்றும் பொருளாதாரத் திறன்
Jalapeño தொடர்பான மிக முக்கியமான தொழில்நுட்பக் கூற்றுகளில் ஒன்று அதன் செயல்திறன் ஆகும். தற்போதைய நவீன மாற்றங்களுடன் ஒப்பிடும்போது, இந்த சிப் குறிப்பிடத்தக்க அளவு சிறந்த performance-per-watt-ஐ வழங்குகிறது என்று ஆரம்பகட்ட சோதனைகளில் OpenAI தெரிவித்துள்ளது. ஹைப்பர்-ஸ்கேல் (hyper-scale) AI உலகில், மின்சாரத் திறன் என்பது வெறும் தொழில்நுட்ப அளவீடு மட்டுமல்ல; அது ஒரு முக்கிய பொருளாதார காரணியாகும்.
நிகழ்நேர கோடிங் மாடல்களை (real-time coding models) இயக்கும்போது செயல்பாட்டுச் செலவுகளைக் குறைக்கும் சிப்பின் திறனை நிறுவனம் குறிப்பாகச் சுட்டிக்காட்டியுள்ளது. OpenAI தனது Codex போன்ற agentic தயாரிப்புகளை விரிவுபடுத்தும்போது, சிக்கலான தர்க்கப் பணிகளை (reasoning tasks) குறைந்த செலவில் (per token) இயக்கும் திறன், லாப வரம்பைப் பராமரிக்கவும், டெவலப்பர்கள் மற்றும் நிறுவனப் பயனர்கள் ஆகிய இருவருக்கும் AI-ஐ மலிவு விலையில் கொண்டு சேர்க்கவும் முக்கியமானது.
Vertical Integration: முழுமையான AI Stack-ஐ மேம்படுத்துதல்
Jalapeño-வின் உருவாக்கம், vertical integration மீதான OpenAI-யின் அர்ப்பணிப்பிற்கு ஒரு சான்றாகும். இந்த நிறுவனம் இனி வெறும் மாடல் உருவாக்குபவர் மட்டுமல்ல; அது ஒரு உள்கட்டமைப்பு வழங்குநராகவும் மாறி வருகிறது. சிப் ஆர்க்கிடெக்சர் (chip architecture), kernels, மெமரி சிஸ்டம்கள், நெட்வொர்க்கிங் மற்றும் deployment scheduling உள்ளிட்ட தொழில்நுட்பத் தளத்தின் (technology stack) ஒவ்வொரு அடுக்கையும் மேம்படுத்துவதை OpenAI-யின் உத்தி உள்ளடக்கியது.
சுவாரஸ்யமாக, Jalapeño சிப்பின் வடிவமைப்பு மற்றும் மேம்பாட்டிற்கு உதவ OpenAI தனது சொந்த AI மாடல்களையே பயன்படுத்தியது. இந்த feedback loop—அதாவது AI தனது அடுத்த தலைமுறை AI-ஐ இயக்கப்போகும் வன்பொருளையே வடிவமைப்பது—வன்பொருள் பொறியியலில் ஒரு மேம்பட்ட பரிணாமத்தைக் குறிக்கிறது. வன்பொருளைக் கட்டுப்படுத்துவதன் மூலம், தனது மென்பொருளும் சிலிக்கானும் (silicon) சரியாக ஒருங்கிணைக்கப்படுவதை OpenAI உறுதி செய்ய முடியும், இது வேகமான மற்றும் நம்பகமான மாடல் செயல்திறனுக்கு வழிவகுக்கும்.
முக்கியக் குறிப்புகள்
- இலக்கு வைக்கப்பட்ட Inference: Jalapeño என்பது ஆரம்பக்கட்ட பயிற்சி செயல்முறையை விட, மாடல்களைப் பயன்படுத்துவதை (deployment) மேம்படுத்துவதற்காக OpenAI மற்றும் Broadcom ஆகியோரால் வடிவமைக்கப்பட்ட ஒரு பிரத்யேக inference processor ஆகும்.
- செயல்திறன் முன்னேற்றம்: ஆரம்பகட்ட முடிவுகள் சிறந்த performance-per-watt-ஐக் காட்டுகின்றன, இது குறிப்பாக கோடிங் மாடல்கள் போன்ற நிகழ்நேர பயன்பாடுகளுக்கான குறைந்த செயல்பாட்டுச் செலவுகளை இலக்கு வைக்கிறது.
- Full-Stack உத்தி: OpenAI முழுமையான vertical integration நோக்கி நகர்ந்து வருகிறது; சிப் ஆர்க்கிடெக்சர் மற்றும் மெமரி சிஸ்டம்கள் முதல் அவற்றின் மூலம் இயங்கும் agentic தயாரிப்புகள் வரை அனைத்தையும் வடிவமைக்கிறது.
