ચેટબોટ્સથી આગળ: AI શા માટે માત્ર જવાબ આપવાથી બદલાઈને અમલીકરણ તરફ આગળ વધવું જોઈએ

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial6 દિવસ પહેલાં3min read

ચેટબોટ્સથી આગળ: AI શા માટે માત્ર જવાબ આપવાથી બદલાઈને અમલીકરણ તરફ આગળ વધવું જોઈએ

In this article

ચેટબોટ્સથી આગળ: AI શા માટે માત્ર જવાબ આપવાથી અમલીકરણ તરફ આગળ વધવું જોઈએ

રિએક્ટિવ (પ્રતિક્રિયાશીલ) AI નો યુગ સમાપ્ત થઈ રહ્યો છે. આપણે માત્ર વ્યાજબી લખાણ જનરેટ કરતા Large Language Models (LLMs) થી આગળ વધીને એવા સ્વાયત્ત એજન્ટ્સ (autonomous agents) તરફ જઈ રહ્યા છીએ જે સતત ડિજિટલ વાતાવરણમાં જટિલ, બહુ-પગલાંવાળા વર્કફ્લોઝનું અમલીકરણ કરવા સક્ષમ છે.

ઝડપી અંતર્જ્ઞાનથી ધીમા તર્ક તરફ

AI નું વર્તમાન ઉત્ક્રાંતિ કમ્પ્યુટેશનલ લોજિકમાં એક મૂળભૂત પરિવર્તન દ્વારા વ્યાખ્યાયિત થાય છે. પરંપરાગત ચેટબોટ્સ "System 1" વિચારધારા પર કામ કરતા હતા—જે ઝડપી, અંતર્જ્ઞાન આધારિત અને આંકડાકીય સંભાવનાના આધારે ટોકન-બાય-ટોકન જનરેશન પર આધારિત હતા. આ મોડલ્સ તાત્કાલિક જવાબો આપતા હતા પરંતુ તેમની પોતાની તર્કશક્તિને ચકાસવાની અથવા પ્રક્રિયા દરમિયાન ભૂલો સુધારવાની ક્ષમતા ધરાવતા નહોતા.

OpenAI ના o1 અને DeepSeek-R1 જેવા મોડલ્સના નેતૃત્વ હેઠળ "thinking LLMs" ના ઉદભવે "System 2" તર્ક રજૂ કર્યો છે. ઇન્ફરન્સ (inference) સમયે વધુ કમ્પ્યુટ પાવરનો ઉપયોગ કરીને, આ મોડલ્સ લાંબી વિચારધારા (chains of thought) જનરેટ કરવા માટે રિઇન્ફોર્સમેન્ટ લર્નિંગનો ઉપયોગ કરે છે. તેઓ ઉકેલના માર્ગો શોધે છે, મધ્યવર્તી પગલાંઓની ચકાસણી કરે છે અને સ્વયં-સુધારો કરે છે, જે સુનિશ્ચિત કરે છે કે માત્ર ચકાસી શકાય તેવા સાચા ઉકેલો જ રજૂ કરવામાં આવે. આ પરિવર્તન મોડલને સર્ચ એન્જિનના વિકલ્પમાંથી તર્ક એન્જિન (reasoning engine) માં બદલવા તરફનું પ્રથમ પગલું છે.

OpenClaw યુગ: Workspace અને Skill ઇન્ટિગ્રેશન

જોકે તર્ક (reasoning) મહત્વપૂર્ણ છે, પરંતુ માત્ર તર્કથી કામ પૂર્ણ થતું નથી. સંશોધકો દલીલ કરે છે કે આગલું મોટું કદલું—"OpenClaw" યુગ—નાજુક, વન-ઓફ ટૂલ કોલ્સથી સતત, સુરક્ષિત વર્કસ્પેસ તરફના પરિવર્તનની માંગ કરે છે.

આ સફળતા Workspace અને Skill ના સંયોજનમાં રહેલી છે:

The Workspace: ફાઇલો, ટર્મિનલ્સ, લોગ્સ અને બ્રાઉઝર્સ ધરાવતું એક સતત વાતાવરણ. શરૂઆતના એજન્ટ્સથી વિપરીત જે પગલાંઓ વચ્ચે સંદર્ભ (context) ગુમાવી દેતા હતા, વર્કસ્પેસ "state" પ્રદાન કરે છે, જેનો અર્થ છે કે AI એક સ્થિર વાતાવરણ સાથે સંપર્ક કરી શકે છે જ્યાં ક્રિયાઓના કાયમી પરિણામો હોય છે.
Skills: સાદા પ્રોમ્પ્ટ્સથી આગળ વધીને, "skills" એ ઓપરેશનલ જ્ઞાનના મોડ્યુલર, પુનઃઉપયોગી બંડલ્સ છે. ઉદાહરણ તરીકે, Anthropic ના Agent Skills, સૂચનાઓ અને સ્ક્રિપ્ટ્સને પેકેજ કરવા માટે SKILL.md ફાઇલોનો ઉપયોગ કરે છે. આ સંસ્થાઓને દરેક પ્રોમ્પ્ટ સાથે નવા વર્કફ્લો બનાવવાની જરૂરિયાત વગર સંસ્થાકીય જાણકારીને પોર્ટેબલ ફોર્મેટમાં સાચવવાની મંજૂરી આપે છે.

સફળતાની પુનઃવ્યાખ્યા: ટાસ્ક ક્લોઝર વિરુદ્ધ જવાબની ચોકસાઈ

જેમ જેમ AI વર્કસ્પેસમાં પ્રવેશશે, તેમ "બુદ્ધિ" (intelligence) ના માપદંડો બદલાવા જોઈએ. ચેટબોટ યુગમાં, મોડલ્સને તેમના જવાબોની ચોકસાઈ પર ગ્રેડ કરવામાં આવતા હતા. એજન્ટિક યુગમાં, સફળતા task closure દ્વારા માપવામાં આવે છે: લક્ષિત વાતાવરણને ચકાસી શકાય તેવા અંતિમ સ્ટેટ (end state) પર લાવવાની ક્ષમતા.

આ પરિવર્તન આધુનિક બેન્ચમાર્કની જટિલતા દ્વારા સાબિત થાય છે. જોકે GPT-4 ટેક્સ્ટમાં ઉત્કૃષ્ટ છે, પરંતુ તેણે શરૂઆતમાં WebArena બેન્ચમાર્કમાં માત્ર 14% કાર્યો પૂર્ણ કર્યા હતા, જે વાસ્તવિક વિશ્વના વેબ વાતાવરણનું અનુકરણ કરે છે. હવે સફળતા માટે માત્ર તેના અંતિમ આઉટપુટને વાંચવાને બદલે "state-action-observation trajectories"—એજન્ટ સિસ્ટમમાં કેવી રીતે આગળ વધે છે તે જોવું—વિશ્લેષણ કરવું જરૂરી છે.

સુરક્ષા અને ગવર્નન્સનું નવું ક્ષેત્ર

વધતી જતી સ્વાયત્તતા સાથે જોખમો પણ વધે છે. કારણ કે વર્કસ્પેસ-આધારિત એજન્ટ્સ પાસે ક્રેડેન્શિયલ્સ, આઇડેન્ટિટી ટોકન્સ અને સંવેદનશીલ રિપોઝીટરીઝનો એક્સેસ હોય છે, તેઓ AI એટેક સરફેસને વિસ્તૃત કરે છે. OpenClaw PRISM અને ClawGuard જેવા ઉભરતા ફ્રેમવર્ક "harnesses" બનાવવા પર ધ્યાન કેન્દ્રિત કરી રહ્યા છે જેમાં પરમિશન કંટ્રોલ, પ્રોવેનન્સ ટ્રેકિંગ અને સેન્ડબોક્સિંગનો સમાવેશ થાય છે. AI ને સાચા સહકર્મચારી તરીકે બનાવવા માટે, ડેવલપર્સે રોલબેક, ડેટા સાર્વભૌમત્વ અને વર્કસ્પેસ હાઈજીન જેવી સમસ્યાઓ ઉકેલવી પડશે જેથી એજન્ટની ભૂલ કાયમી આર્કિટેક્ચરલ ખામી ન બની જાય.

મુખ્ય મુદ્દાઓ

Reasoning Shift: AI "System 1" (ઝડપી, રિએક્ટિવ) થી "System 2" (ધીમો, વિચારશીલ) તર્ક તરફ આગળ વધી રહ્યું છે, જે સ્વયં-સુધારણા માટે ઇન્ફરન્સ સમયે વધારાના કમ્પ્યુટનો ઉપયોગ કરે છે.
Workspace + Skill: સાચી સ્વાયત્તતા માટે મોડ્યુલર, પુનઃઉપયોગી "skills" સાથે જોડાયેલા સતત ડિજિટલ વર્કસ્પેસની જરૂર છે જેથી વર્કફ્લો પુનરાવર્તિત અને સ્કેલેબલ બની શકે.
New Evaluation Metrics: સફળતા હવે ટેક્સ્ટ પ્રતિસાદની વ્યાજબીતા વિશે નથી, પરંતુ "task closure" વિશે છે—એટલે કે જટિલ વાતાવરણમાં વર્કફ્લોને ચકાસી શકાય તે રીતે પૂર્ણ કરવો.