ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த கட்டம்

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 வாரங்களுக்கு முன்3min read

ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த கட்டம்

In this article

ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த எல்லை

செயற்கை நுண்ணறிவின் (AI) பரிணாமம், நிலையான குறியீடு உருவாக்கத்திலிருந்து (static code generation) மாறும் தன்மை கொண்ட, சுய-நிலைநிறுத்தப்பட்ட சூழல்களை நோக்கி (dynamic, self-sustaining ecosystems) வேகமாக நகர்ந்து கொண்டிருக்கிறது. டெவலப்பர்கள் குறியீடுகளை எழுதுவதிலிருந்து ஏஜென்ட்களைப் (agents) பயன்படுத்துவதற்கு மாறும்போது, இந்தத் துறை இப்போது "லூப்களின்" (loops) யுகத்திற்குள் நுழைகிறது—இங்கு ஏஜென்ட்கள் மற்ற ஏஜென்ட்களுக்குத் தொடர்ச்சியான, மீண்டும் மீண்டும் செய்யப்படும் பணிகளைச் செய்யத் தூண்டுகின்றன.

மூலக் குறியீட்டிலிருந்து ஏஜென்டிக் கூட்டங்கள் வரை

Meta-வின் @Scale மாநாட்டில், Claude Code-ன் படைப்பாளர் Boris Cherny, AI மேம்பாட்டுச் சுழற்சியில் (AI development lifecycle) ஏற்பட்டுள்ள ஒரு ஆழமான மாற்றத்தைச் சுட்டிக்காட்டினார். இதற்கு முந்தைய முக்கிய மைல்கல், கைமுறை மூலக் குறியீட்டிலிருந்து (manual source code) AI-ஆல் எழுதப்பட்ட குறியீட்டிற்கு மாறியது; ஆனால், அடுத்தப் பாய்ச்சல் அதற்கு இணையான முக்கியத்துவம் வாய்ந்தது என்று Cherny வாதிடுகிறார்: அதாவது, ஏஜென்ட்கள் மற்ற ஏஜென்ட்களை நிர்வகிக்கும் மாற்றத்திற்கு மாறுவது.

இது வெறும் தத்துவார்த்தமானது மட்டுமல்ல; நிபுணத்துவம் பெற்ற ஏஜென்ட்கள் ஒரு தொடர்ச்சியான சுழற்சியில் செயல்படும் ஒரு பணிப்பாய்வை (workflow) Cherny விவரிக்கிறார். உதாரணமாக, ஒரு ஏஜென்ட் குறியீடு கட்டமைப்பை (code architecture) மேம்படுத்துவதில் மட்டும் கவனம் செலுத்தலாம், அதே நேரத்தில் மற்றொரு ஏஜென்ட் ஒருங்கிணைப்பதற்காகத் திரும்பத் திரும்ப வரும் அப்ஸ்ட்ராக்ஷன்களை (duplicated abstractions) ஸ்கேன் செய்யலாம். இந்த ஏஜென்ட்கள் மனித பொறியாளர்களைப் போலவே செயல்பட்டு, pull requests-களைச் சமர்ப்பித்து, ஒத்திசைவற்ற முறையில் (asynchronously) பணியாற்றுகின்றன. பாரம்பரியத் தானியங்கி முறைகளைப் போலன்றி, இந்த லூப்கள் 'non-deterministic' தன்மை கொண்டவை; அதாவது, ஒரு கடினமான வெளியேறும் நிபந்தனையைப் (hard-coded exit condition) பின்பற்றுவதற்குப் பதிலாக, ஒரு துணை-ஏஜென்ட் (sub-agent) தனது பகுத்தறிவைப் பயன்படுத்தி ஒரு பணி போதுமான அளவு மேம்படுத்தப்பட்டதா அல்லது முடிக்கப்பட்டதா என்பதைத் தீர்மானிக்கிறது.

லூப் லாஜிக் மற்றும் டெஸ்ட்-டைம் கம்ப்யூட்டைப் புரிந்துகொள்ளுதல்

"லூப்கள்" என்ற கருத்து அடிப்படை கணினி அறிவியலில் இருந்து—குறிப்பாக रिकர்சிவ் ஃபங்ஷன்களிலிருந்து (recursive functions)—மெடுக்கொள்ளப்பட்டாலும், இது நிகழ்தகவு பகுத்தறிவு (probabilistic reasoning) என்ற ஒரு புதிய அடுக்கைச் சேர்க்கிறது. இதில் குறிப்பிடத்தக்க ஒரு முறை "Ralph Loop" (சிம்ப்சன்ஸ் கதாபாத்திரமான Ralph Wiggum என்பவரின் பெயரால் அழைக்கப்படுகிறது) ஆகும்; இது நீண்ட பணிகளின் போது மாடல்கள் திசைமாறிப் போவதைத் (drifting) தடுக்கப் பயன்படுத்தப்படும் ஒரு நுட்பமாகும். மாடல் தனது சொந்த முன்னேற்றத்தைச் சுருக்கி, தான் இலக்கை அடைந்துவிட்டதா என்பதை மதிப்பீடு செய்கிறது, இதன் மூலம் ஒரு வெற்றிகரமான முடிவு கிடைக்கும் வரை தர்க்கத்தை (logic) முன்னும் பின்னுமாகத் திருப்பித் தள்ளுகிறது.

இந்தப் போக்கு "test-time compute" என்ற கருத்துடன் நெருங்கிய தொடர்புடையது. OpenAI ஆராய்ச்சியாளர் Noam Brown குறிப்பிட்டது போல, போதுமான கணக்கீட்டு வளங்கள் (computational resources) வழங்கப்பட்டால், தற்கால மாடல்களால் சிக்கலான சிக்கல்களைத் தீர்க்க முடியும். ஒரு codebase-ஐ படிப்படியாக மேம்படுத்துவது போன்ற "hill-climbing" சூழல்களில், லூப்கள் ஒரு AI-க்கு ஒரு சிக்கலில் தொடர்ந்து மீண்டும் மீண்டும் செயல்பட அனுமதிக்கின்றன; ஒரு குறிப்பிட்ட வரம்பு (threshold) எட்டப்படும் வரை அதிகப்படியான கம்ப்யூட்டைப் பயன்படுத்தி சிறந்த செயல்திறனைப் பெற இவை உதவுகின்றன.

பொருளாதார யதார்த்தம்: டோக்கன் நுகர்வு vs மதிப்பு

ஏஜென்டிக் லூப்களின் தொழில்நுட்பத் திறன் வியக்கத்தக்கதாக இருந்தாலும், அதன் பொருளாதாரத் தாக்கங்கள் குறிப்பிடத்தக்கவை. ஒரு சாதாரண கேள்வி-பதில் (Q&A) சாட்பாட் தொடர்பைப் போலன்றி, ஏஜென்டிக் லூப்கள் பின்னணியில் முடிவில்லாமல் இயங்கும் வகையில் வடிவமைக்கப்பட்டுள்ளன. இது டோக்கன் நுகர்வில் (token consumption) மிகப்பெரிய அதிகரிப்பை ஏற்படுத்துகிறது, இது நிறுவனங்களுக்குச் செலவுகள் விண்ணைத் தொடும் நிலைக்குக் கொண்டு செல்லக்கூடும்.

Anthropic போன்ற AI வழங்குநர்களுக்கு, இது அதிக வளர்ச்சியைத் தரும் வருவாய் மாதிரியாகும். இருப்பினும், டெவலப்பர்கள் மற்றும் நிறுவனர்களாகிய அவர்களுக்கு, லூப்களைச் செயல்படுத்துவதற்கு ஒரு நுணுக்கமான சமநிலை தேவைப்படுகிறது. இந்த புதிய சூழலில் வெற்றி என்பது, "drift" (AI தனது அசல் இலக்கை மறப்பது) என்பதை நிர்வகிக்கக் கடுமையான மேற்பார்வையைச் செயல்படுத்துவதிலும், லூப் மூலம் உருவாக்கப்படும் மதிப்பு அதன் செயல்பாட்டுச் செலவை விட அதிகமாக இருப்பதை உறுதி செய்ய, டோக்கன் செலவினத்தின் மீது கடுமையான கட்டுப்பாடுகளை (guardrails) விதிப்பதிலும் தான் உள்ளது.

முக்கியக் குறிப்புகள்

தன்னாட்சியில் மாற்றம்: AI என்பது ஒற்றை முறை குறியீடு உருவாக்கத்திலிருந்து (single-turn code generation), ஏஜென்ட்கள் ஒன்றையொன்று கண்காணித்துத் தூண்டும் தன்னாட்சி ஏஜென்டிக் லூப்களை நோக்கி நகர்கிறது.
Test-Time Compute: ஏஜென்டிக் லூப்கள், சிக்கலான, மீண்டும் மீண்டும் செய்யப்படும் "hill-climbing" சிக்கல்களைத் தீர்க்க, இன்ஃபரன்ஸ் (inference) கட்டத்தின் போது கூடுதல் கணக்கீட்டுத் திறனைப் பயன்படுத்துகின்றன.
செலவு மேலாண்மை மிக முக்கியமானது: இந்த லூப்களின் தொடர்ச்சியான தன்மை, டோக்கன் நுகர்வை அதிவேகமாக அதிகரிக்கக்கூடும், எனவே நிறுவனங்கள் இதனைப் பயன்படுத்தும்போது மேற்பார்வை மற்றும் பட்ஜெட் கட்டுப்பாடுகள் (guardrails) அவசியமானவை.

ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த கட்டம்

ஏஜென்டிக் லூப்களின் எழுச்சி: AI தன்னாட்சியில் அடுத்த எல்லை

மூலக் குறியீட்டிலிருந்து ஏஜென்டிக் கூட்டங்கள் வரை

லூப் லாஜிக் மற்றும் டெஸ்ட்-டைம் கம்ப்யூட்டைப் புரிந்துகொள்ளுதல்

பொருளாதார யதார்த்தம்: டோக்கன் நுகர்வு vs மதிப்பு

முக்கியக் குறிப்புகள்

Continue reading

ஏஜென்டிக் AI என்பது ஒரு கருவி அல்ல; அது ஒரு செயல்பாட்டுத் திறன்.

The Agentic Loop: A Practical Field Guide

The Agentic Loop: A Practical Field Guide

ஏஜென்டிக் AI-ன் எழுச்சி: தொழில்நுட்பக் குழுக்கள் ஏன் ஆட்டோமேஷன் துறையில் முன்னிலை வகிக்கின்றன?