ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த எல்லை

செயற்கை நுண்ணறிவின் (AI) பரிணாமம், நிலையான குறியீடு உருவாக்கத்திலிருந்து (static code generation) மாறும் தன்மை கொண்ட, சுய-நிலைநிறுத்தப்பட்ட சூழல்களை நோக்கி (dynamic, self-sustaining ecosystems) வேகமாக நகர்ந்து கொண்டிருக்கிறது. டெவலப்பர்கள் குறியீடுகளை எழுதுவதிலிருந்து ஏஜென்ட்களைப் (agents) பயன்படுத்துவதற்கு மாறும்போது, இந்தத் துறை இப்போது "லூப்களின்" (loops) யுகத்திற்குள் நுழைகிறது—இங்கு ஏஜென்ட்கள் மற்ற ஏஜென்ட்களுக்குத் தொடர்ச்சியான, மீண்டும் மீண்டும் செய்யப்படும் பணிகளைச் செய்யத் தூண்டுகின்றன.

மூலக் குறியீட்டிலிருந்து ஏஜென்டிக் கூட்டங்கள் வரை

Meta-வின் @Scale மாநாட்டில், Claude Code-ன் படைப்பாளர் Boris Cherny, AI மேம்பாட்டுச் சுழற்சியில் (AI development lifecycle) ஏற்பட்டுள்ள ஒரு ஆழமான மாற்றத்தைச் சுட்டிக்காட்டினார். இதற்கு முந்தைய முக்கிய மைல்கல், கைமுறை மூலக் குறியீட்டிலிருந்து (manual source code) AI-ஆல் எழுதப்பட்ட குறியீட்டிற்கு மாறியது; ஆனால், அடுத்தப் பாய்ச்சல் அதற்கு இணையான முக்கியத்துவம் வாய்ந்தது என்று Cherny வாதிடுகிறார்: அதாவது, ஏஜென்ட்கள் மற்ற ஏஜென்ட்களை நிர்வகிக்கும் மாற்றத்திற்கு மாறுவது.

இது வெறும் தத்துவார்த்தமானது மட்டுமல்ல; நிபுணத்துவம் பெற்ற ஏஜென்ட்கள் ஒரு தொடர்ச்சியான சுழற்சியில் செயல்படும் ஒரு பணிப்பாய்வை (workflow) Cherny விவரிக்கிறார். உதாரணமாக, ஒரு ஏஜென்ட் குறியீடு கட்டமைப்பை (code architecture) மேம்படுத்துவதில் மட்டும் கவனம் செலுத்தலாம், அதே நேரத்தில் மற்றொரு ஏஜென்ட் ஒருங்கிணைப்பதற்காகத் திரும்பத் திரும்ப வரும் அப்ஸ்ட்ராக்ஷன்களை (duplicated abstractions) ஸ்கேன் செய்யலாம். இந்த ஏஜென்ட்கள் மனித பொறியாளர்களைப் போலவே செயல்பட்டு, pull requests-களைச் சமர்ப்பித்து, ஒத்திசைவற்ற முறையில் (asynchronously) பணியாற்றுகின்றன. பாரம்பரியத் தானியங்கி முறைகளைப் போலன்றி, இந்த லூப்கள் 'non-deterministic' தன்மை கொண்டவை; அதாவது, ஒரு கடினமான வெளியேறும் நிபந்தனையைப் (hard-coded exit condition) பின்பற்றுவதற்குப் பதிலாக, ஒரு துணை-ஏஜென்ட் (sub-agent) தனது பகுத்தறிவைப் பயன்படுத்தி ஒரு பணி போதுமான அளவு மேம்படுத்தப்பட்டதா அல்லது முடிக்கப்பட்டதா என்பதைத் தீர்மானிக்கிறது.

லூப் லாஜிக் மற்றும் டெஸ்ட்-டைம் கம்ப்யூட்டைப் புரிந்துகொள்ளுதல்

"லூப்கள்" என்ற கருத்து அடிப்படை கணினி அறிவியலில் இருந்து—குறிப்பாக रिकர்சிவ் ஃபங்ஷன்களிலிருந்து (recursive functions)—மெடுக்கொள்ளப்பட்டாலும், இது நிகழ்தகவு பகுத்தறிவு (probabilistic reasoning) என்ற ஒரு புதிய அடுக்கைச் சேர்க்கிறது. இதில் குறிப்பிடத்தக்க ஒரு முறை "Ralph Loop" (சிம்ப்சன்ஸ் கதாபாத்திரமான Ralph Wiggum என்பவரின் பெயரால் அழைக்கப்படுகிறது) ஆகும்; இது நீண்ட பணிகளின் போது மாடல்கள் திசைமாறிப் போவதைத் (drifting) தடுக்கப் பயன்படுத்தப்படும் ஒரு நுட்பமாகும். மாடல் தனது சொந்த முன்னேற்றத்தைச் சுருக்கி, தான் இலக்கை அடைந்துவிட்டதா என்பதை மதிப்பீடு செய்கிறது, இதன் மூலம் ஒரு வெற்றிகரமான முடிவு கிடைக்கும் வரை தர்க்கத்தை (logic) முன்னும் பின்னுமாகத் திருப்பித் தள்ளுகிறது.

இந்தப் போக்கு "test-time compute" என்ற கருத்துடன் நெருங்கிய தொடர்புடையது. OpenAI ஆராய்ச்சியாளர் Noam Brown குறிப்பிட்டது போல, போதுமான கணக்கீட்டு வளங்கள் (computational resources) வழங்கப்பட்டால், தற்கால மாடல்களால் சிக்கலான சிக்கல்களைத் தீர்க்க முடியும். ஒரு codebase-ஐ படிப்படியாக மேம்படுத்துவது போன்ற "hill-climbing" சூழல்களில், லூப்கள் ஒரு AI-க்கு ஒரு சிக்கலில் தொடர்ந்து மீண்டும் மீண்டும் செயல்பட அனுமதிக்கின்றன; ஒரு குறிப்பிட்ட வரம்பு (threshold) எட்டப்படும் வரை அதிகப்படியான கம்ப்யூட்டைப் பயன்படுத்தி சிறந்த செயல்திறனைப் பெற இவை உதவுகின்றன.

பொருளாதார யதார்த்தம்: டோக்கன் நுகர்வு vs மதிப்பு

ஏஜென்டிக் லூப்களின் தொழில்நுட்பத் திறன் வியக்கத்தக்கதாக இருந்தாலும், அதன் பொருளாதாரத் தாக்கங்கள் குறிப்பிடத்தக்கவை. ஒரு சாதாரண கேள்வி-பதில் (Q&A) சாட்பாட் தொடர்பைப் போலன்றி, ஏஜென்டிக் லூப்கள் பின்னணியில் முடிவில்லாமல் இயங்கும் வகையில் வடிவமைக்கப்பட்டுள்ளன. இது டோக்கன் நுகர்வில் (token consumption) மிகப்பெரிய அதிகரிப்பை ஏற்படுத்துகிறது, இது நிறுவனங்களுக்குச் செலவுகள் விண்ணைத் தொடும் நிலைக்குக் கொண்டு செல்லக்கூடும்.

Anthropic போன்ற AI வழங்குநர்களுக்கு, இது அதிக வளர்ச்சியைத் தரும் வருவாய் மாதிரியாகும். இருப்பினும், டெவலப்பர்கள் மற்றும் நிறுவனர்களாகிய அவர்களுக்கு, லூப்களைச் செயல்படுத்துவதற்கு ஒரு நுணுக்கமான சமநிலை தேவைப்படுகிறது. இந்த புதிய சூழலில் வெற்றி என்பது, "drift" (AI தனது அசல் இலக்கை மறப்பது) என்பதை நிர்வகிக்கக் கடுமையான மேற்பார்வையைச் செயல்படுத்துவதிலும், லூப் மூலம் உருவாக்கப்படும் மதிப்பு அதன் செயல்பாட்டுச் செலவை விட அதிகமாக இருப்பதை உறுதி செய்ய, டோக்கன் செலவினத்தின் மீது கடுமையான கட்டுப்பாடுகளை (guardrails) விதிப்பதிலும் தான் உள்ளது.

முக்கியக் குறிப்புகள்

  • தன்னாட்சியில் மாற்றம்: AI என்பது ஒற்றை முறை குறியீடு உருவாக்கத்திலிருந்து (single-turn code generation), ஏஜென்ட்கள் ஒன்றையொன்று கண்காணித்துத் தூண்டும் தன்னாட்சி ஏஜென்டிக் லூப்களை நோக்கி நகர்கிறது.
  • Test-Time Compute: ஏஜென்டிக் லூப்கள், சிக்கலான, மீண்டும் மீண்டும் செய்யப்படும் "hill-climbing" சிக்கல்களைத் தீர்க்க, இன்ஃபரன்ஸ் (inference) கட்டத்தின் போது கூடுதல் கணக்கீட்டுத் திறனைப் பயன்படுத்துகின்றன.
  • செலவு மேலாண்மை மிக முக்கியமானது: இந்த லூப்களின் தொடர்ச்சியான தன்மை, டோக்கன் நுகர்வை அதிவேகமாக அதிகரிக்கக்கூடும், எனவே நிறுவனங்கள் இதனைப் பயன்படுத்தும்போது மேற்பார்வை மற்றும் பட்ஜெட் கட்டுப்பாடுகள் (guardrails) அவசியமானவை.