"Tokenmaxxing"-லிருந்து ROI வரை: AI யதார்த்தம் குறித்த NEA-வின் Tiffany Luck-ன் கருத்துக்கள்
செலவைப் பொருட்படுத்தாமல் வரம்பற்ற AI பயன்பாட்டை சிலிக்கான் வேலி சிஇஓக்கள் ஊக்குவித்த "tokenmaxxing" காலம், தற்போது தீவிர நிதி ஆய்வுக்கு வழிவகுக்கும் ஒரு காலத்திற்கு வேகமாக மாறி வருகிறது. நிறுவனங்கள் ஆரம்பகாலப் பரபரப்பைக் கடந்து வரும்போது, கவனம் வெறும் பயன்பாட்டிலிருந்து (consumption), நிரூபிக்கக்கூடிய முதலீட்டின் மீதான லாபம் (ROI) நோக்கி மாறியுள்ளது.
"Tokenmaxxing" காலத்தின் முடிவு
இந்த ஆண்டின் தொடக்கத்தில், தொழில்நுட்பத் துறையில் நிலவிய முக்கியப் போக்கு "tokenmaxxing" ஆகும்; அதாவது பயன்பாட்டை அதிகப்படுத்துவதற்காக சாத்தியமான அனைத்து பணிப்பாய்வுகளிலும் (workflows) AI-ஐ ஒருங்கிணைக்க வேண்டும் என்ற முனைப்பு. இருப்பினும், பெரிய மொழி மாதிரிகளின் (LLM) பயன்பாட்டிற்கான மிக அதிகமான செலவுகள், ஒரு முக்கிய யதார்த்தத்தை உணரச் செய்துள்ளது. Uber போன்ற நிறுவனங்கள் தங்களது முழு ஆண்டு கால AI பட்ஜெட்டையும் சில மாதங்களிலேயே தீர்த்துவிட்டதாக உயர்நிலை அறிக்கைகள் தெரிவிக்கின்றன.
இந்த நிதி அழுத்தம், நிறுவனங்கள் கடுமையான கட்டுப்பாடுகளை அமல்படுத்தத் தூண்டியுள்ளது. சில நிறுவனங்கள் குறிப்பிட்ட துறைகளுக்கான Claude உரிமங்களைக் குறைப்பது அல்லது Meta போன்ற நிறுவனங்கள் தங்களது உள்நாட்டு AI லீடர்போர்டுகளை நிறுத்துவது போன்ற நடவடிக்கைகளை எடுத்துள்ளன. NEA கூட்டாளியான Tiffany Luck போன்ற வென்ச்சர் கேபிடலிஸ்ட்களைப் பொறுத்தவரை, இந்த மாற்றம் சோதனை ரீதியான செலவினங்களிலிருந்து, ஒழுங்குபடுத்தப்பட்ட "ROI கணக்கீடு" (ROI reckoning) நோக்கிய மாற்றத்தைக் குறிக்கிறது.
மாடல் அக்னாஸ்டிசிசம் (Model Agnosticism) மற்றும் பயன்பாட்டு உத்திகளின் எழுச்சி
நிறுவனங்கள் இந்தச் செலவுகளைக் கையாள முயலும்போது, ஒரு புதிய வகை பயன்பாட்டு முறை உருவாகி வருகிறது. ஒரே ஒரு சேவை வழங்குநரை மட்டும் சார்ந்து இருக்காமல், செயல்திறன் மற்றும் விலை ஆகிய இரண்டையும் மேம்படுத்த நிறுவனங்கள் பல்வேறு மாடல்களை "கலந்து பயன்படுத்துவதை" (mixing and matching) அதிகளவில் மேற்கொண்டு வருகின்றன. இந்த பல-மாடல் அணுகுமுறை (multi-model approach), நிறுவனங்கள் சிக்கலான பணிகளுக்கு அதிகத் திறன் கொண்ட, விலையுயர்ந்த மாடல்களையும், வழக்கமான தானியங்கிப் பணிகளுக்குச் சிறிய மற்றும் மலிவான மாடல்களையும் பயன்படுத்த அனுமதிக்கிறது.
இந்த ஒருங்கிணைப்பை எளிதாக்க, ஒரு புதிய வகைத் திறமையாளர்கள் அவசியமாகி வருகின்றனர்: அவர்கள் "ஃபார்வர்ட்-டெப்ளாய்டு இன்ஜினியர்கள்" (forward-deployed engineers). பெரிய நிறுவனங்களுக்குள் AI பயன்பாட்டை ஊக்குவிப்பதில் இந்த இன்ஜினியர்கள் ஒரு "டிரோஜன் ஹார்ஸ்" (Trojan horse) போலச் செயல்படுகிறார்கள் என்று Luck கூறுகிறார். செயல்பாட்டுத் தளங்களில் நேரடியாகப் பணியாற்றுவதன் மூலம், அடிப்படை மாடல் திறன்களுக்கும், குறிப்பிட்ட மதிப்புமிக்க வணிகப் பயன்பாட்டுத் தேவைகளுக்கும் இடையிலான இடைவெளியைக் குறைக்க இவர்கள் உதவுகிறார்கள். இதன் மூலம் AI கருவிகள் வெறும் சிக்கலை அதிகரிப்பதற்குப் பதிலாக, நிறுவனங்களின் சிக்கல்களைத் தீர்ப்பதை இவர்கள் உறுதி செய்கிறார்கள்.
முழு AI ஸ்டேக் (AI Stack) முழுவதும் மதிப்பைக் கண்டறிதல்
தற்போதைய சந்தையில் நிலவும் ஒரு பொதுவான தவறான கருத்து என்னவென்றால், மதிப்பு என்பது மாடல் நிலையில் (model layer) மட்டுமே குவிந்து கிடக்கிறது என்பதாகும். மிகவும் சக்திவாய்ந்த LLM-க்கான போட்டி தொடர்ந்தாலும், AI ஸ்டேக்கின் ஒவ்வொரு நிலையிலும் குறிப்பிடத்தக்க மதிப்பு உருவாக்கம் நடைபெறுவதாக Tiffany Luck வாதிடுகிறார்.
நிறுவனங்கள் AI செலவினங்களைக் கண்காணிக்க உதவும் சிறப்பு உள்கட்டமைப்புகளை உருவாக்கும் ஸ்டார்ட்அப்கள் முதல், நுகர்வோர் அனுபவங்களில் 'மந்திர தருணங்களை' வழங்கும் 'தனிநபர் முகவர்களை' உருவாக்கும் டெவலப்பர்கள் வரை, வாய்ப்புகள் பன்முகத்தன்மை பெற்று வருகின்றன. இந்தத் துறை முதிர்ச்சியடையும் போது, அதிகப்படியான டோக்கன்களை (tokens) மட்டும் வழங்கும் நிறுவனங்கள் வெற்றியாளர்களாக இருக்க மாட்டார்கள்; மாறாக, மிகவும் திறமையான, ஒருங்கிணைந்த மற்றும் அளவிடக்கூடிய நுண்ணறிவை வழங்கும் நிறுவனங்களே வெற்றியாளர்களாகத் திகழும்.
முக்கியக் கருத்துக்கள்
- ROI மாற்றம்: நிறுவனங்கள் 'tokenmaxxing' மற்றும் கட்டுப்பாடற்ற AI செலவினங்களிலிருந்து விலகி, முதலீட்டின் மீதான வருவாயை (return on investment) துல்லியமாக அளவிடுவதை நோக்கி நகர்கின்றன.
- மூலோபாய மாடல் கலவை (Strategic Model Mixing): செலவு மற்றும் திறனைச் சமநிலைப்படுத்த பல்வேறு மாடல்களின் கலவையைப் பயன்படுத்துவதன் மூலம், நிறுவனங்கள் 'vendor lock-in' நிலையைத் தவிர்க்கின்றன.
- அடுக்கு மதிப்பு (Layered Value): மாடல் மேம்பாடு முக்கியமானது என்றாலும், பயன்பாட்டு கருவிகள் (deployment tools) மற்றும் சிறப்பு முகவர் சார்ந்த பயன்பாடுகள் (specialized agentic applications) உட்பட முழுத் தொழில்நுட்ப அடுக்குப்படியும் (entire stack) மிகப்பெரிய வாய்ப்புகள் உள்ளன.