એજન્ટિક લૂપ્સનો ઉદય: AI સ્વાયત્તતામાં આગામી સીમા

આર્ટિફિશિયલ ઇન્ટેલિજન્સનું ઉત્ક્રાંતિ સ્થિર કોડ જનરેશનથી ગતિશીલ, સ્વ-નિર્વાહિત ઇકોસિસ્ટમ્સ તરફ ઝડપથી આગળ વધી રહી છે. જેમ જેમ ડેવલપર્સ કોડ લખવાથી એજન્ટ્સનો ઉપયોગ કરવા તરફ વળી રહ્યા છે, તેમ ઉદ્યોગ હવે "લૂપ્સ" (loops) ના યુગમાં પ્રવેશ કરી રહ્યો છે—જ્યાં એજન્ટ્સ સતત, પુનરાવર્તિત કાર્ય કરવા માટે અન્ય એજન્ટ્સને પ્રોમ્પ્ટ કરે છે.

સોર્સ કોડથી એજન્ટિક સ્વોર્મ્સ (Agentic Swarms) સુધી

Meta ના @Scale કોન્ફરન્સમાં, Claude Code ના સર્જક Boris Cherny એ AI ડેવલપમેન્ટ લાઇફસાયકલમાં એક ઊંડાણપૂર્વક આવેલા ફેરફાર પર પ્રકાશ પાડ્યો હતો. જ્યારે અગાઉનો મુખ્ય સીમાચિહ્ન મેન્યુઅલ સોર્સ કોડથી AI-લખાયેલા કોડ તરફનું સ્થળાંતર હતું, ત્યારે Cherny દલીલ કરે છે કે આગામી કૂદકો તેટલો જ મહત્વપૂર્ણ છે: એજન્ટ્સ દ્વારા અન્ય એજન્ટ્સનું સંચાલન.

આ માત્ર સૈદ્ધાંતિક નથી; Cherny એક એવા વર્કફ્લોનું વર્ણન કરે છે જ્યાં વિશિષ્ટ એજન્ટ્સ સતત ચક્રમાં કાર્ય કરે છે. ઉદાહરણ તરીકે, એક એજન્ટ ફક્ત કોડ આર્કિટેક્ચરને સુધારવા પર ધ્યાન કેન્દ્રિત કરી શકે છે, જ્યારે બીજો એકીકૃત કરવા માટે ડુપ્લીકેટ એબ્સ્ટ્રેક્શન (abstractions) માટે સ્કેન કરી શકે છે. આ એજન્ટો માનવ એન્જિનિયરોની જેમ કાર્ય કરે છે, પુલ રિક્વેસ્ટ (pull requests) સબમિટ કરે છે અને અસિંક્રોનસ રીતે કામ કરે છે. પરંપરાગત ઓટોમેશનથી વિપરીત, આ લૂપ્સ નોન-ડિટરમિનિસ્ટિક (non-deterministic) છે; હાર્ડ-કોડેડ એક્ઝિટ કન્ડિશનનું પાલન કરવાને બદલે, સબ-એજન્ટ તર્ક (reasoning) નો ઉપયોગ કરીને નક્કી કરે છે કે કાર્ય પૂરતું ઓપ્ટિમાઇઝ અથવા પૂર્ણ થયું છે કે નહીં.

લૂપ લોજિક અને ટેસ્ટ-ટાઇમ કમ્પ્યુટને સમજવું

"લૂપ્સ" નો ખ્યાલ મૂળભૂત કોમ્પ્યુટર સાયન્સ—ખાસ કરીને રિકર્સિવ ફંક્શન્સ (recursive functions)—માંથી લેવામાં આવ્યો છે—પરંતુ તેમાં સંભવિત તર્ક (probabilistic reasoning) નો એક સ્તર ઉમેરવામાં આવ્યો છે. એક નોંધપાત્ર પેટર્ન "Ralph Loop" છે (Simpsons પાત્ર Ralph Wiggum ના નામ પરથી), જે લાંબા કાર્યો દરમિયાન મોડેલ્સને ડ્રિફ્ટ થતા અટકાવવા માટે વપરાતી તકનીક છે. મોડેલ તેની પોતાની પ્રગતિનો સારાંશ આપે છે અને તે તેના લક્ષ્યને પ્રાપ્ત કર્યું છે કે નહીં તેનું મૂલ્યાંકન કરે છે, જે અનિવાર્યપણે સફળ પરિણામ મળે ત્યાં સુધી તર્કને આગળ-પાછળ "બાઉન્સ" કરે છે.

આ વલણ "test-time compute" ના ખ્યાલ સાથે ગાઢ રીતે જોડાયેલું છે. OpenAI ના સંશોધક Noam Brown એ નોંધ્યું છે તેમ, જો પૂરતા કમ્પ્યુટેશનલ સંસાધનો પૂરા પાડવામાં આવે તો સમકાલીન મોડેલ્સ વધુને વધુ જટિલ સમસ્યાઓ ઉકેલી શકે છે. "hill-climbing" પરિસ્થિતિઓમાં—જેમ કે કોડબેઝમાં ક્રમિક સુધારો—લૂપ્સ AI ને સમસ્યા પર સતત કામ કરવાની મંજૂરી આપે છે, જે ચોક્કસ મર્યાદા (threshold) પ્રાપ્ત થાય ત્યાં સુધી ઉચ્ચ સ્તરની કામગીરી મેળવવા માટે વધુ કમ્પ્યુટનો ઉપયોગ કરે છે.

આર્થિક વાસ્તવિકતા: ટોકન વપરાશ વિરુદ્ધ મૂલ્ય

જોકે એજન્ટિક લૂપ્સની તકનીકી ક્ષમતા આશ્ચર્યજનક છે, પરંતુ તેના આર્થિક અસરો નોંધપાત્ર છે. પ્રમાણભૂત Q&A ચેટબોટ ઇન્ટરેક્શનથી વિપરીત, એજન્ટિક લૂપ્સ બેકગ્રાઉન્ડમાં અનંતકાળ સુધી ચાલવા માટે રચાયેલ છે. આ ટોકન વપરાશમાં મોટો ઉછાળો લાવે છે, જે એન્ટરપ્રાઇઝ માટે ખર્ચમાં ધરખમ વધારો કરી શકે છે.

Anthropic જેવા AI પ્રદાતાઓ માટે, આ ઉચ્ચ-વૃદ્ધિ ધરાવતું રેવન્યુ મોડેલ છે. જોકે, ડેવલપર્સ અને ફાઉન્ડર્સ માટે, લૂપ્સનો અમલ કરવા માટે અત્યંત સંતુલનની જરૂર છે. આ નવા લેન્ડસ્કેપમાં સફળતા "ડ્રિફ્ટ" (જ્યાં AI મૂળ લક્ષ્ય ગુમાવી દે છે) ને મેનેજ કરવા માટે કડક દેખરેખ રાખવા અને ટોકન ખર્ચ પર કડક ગાર્ડરેલ્સ (guardrails) સ્થાપિત કરવા પર નિર્ભર રહેશે, જેથી ખાતરી કરી શકાય કે લૂપ દ્વારા ઉત્પાદિત મૂલ્ય તેના ઓપરેશનલ ખર્ચ કરતા વધુ હોય.

મુખ્ય મુદ્દાઓ

  • સ્વાયત્તતામાં ફેરફાર: AI સિંગલ-ટર્ન કોડ જનરેશનથી સ્વાયત્ત એજન્ટિક લૂપ્સ તરફ આગળ વધી રહ્યું છે જ્યાં એજન્ટો એકબીજા પર દેખરેખ રાખે છે અને પ્રોમ્પ્ટ કરે છે.
  • Test-Time Compute: એજન્ટિક લૂપ્સ જટિલ, પુનરાવર્તિત "hill-climbing" સમસ્યાઓ ઉકેલવા માટે ઇન્ફરન્સ ફેઝ દરમિયાન વધારાના કમ્પ્યુટનો ઉપયોગ કરે છે.
  • ખર્ચનું સંચાલન મહત્વપૂર્ણ છે: આ લૂપ્સના સતત સ્વભાવને કારણે ટોકન વપરાશમાં ઘાતક વધારો થઈ શકે છે, જે એન્ટરપ્રાઇઝ સ્વીકૃતિ માટે દેખરેખ અને બજેટ ગાર્ડરેલ્સને આવશ્યક બનાવે છે.