ઓટોનોમસ એજન્ટ માટે કોઈ પુલ રિક્વેસ્ટ (Pull Request) હોતી નથી
પરંપરાગત સુરક્ષા સમીક્ષાઓ (security reviews) 'diff' પર આધારિત હોય છે. કોઈ વ્યક્તિ પુલ રિક્વેસ્ટ (pull request) ખોલે છે. કોઈ તેને વાંચે છે. પ્રોડક્શનમાં રહેલો કોડ એ જ કોડ હોય છે જે તમે સમીક્ષા કરી હતી.
ઓટોનોમસ એજન્ટ્સ આ મોડેલને તોડી નાખે છે.
એક એજન્ટ રનટાઇમ (runtime) પર પ્લાનિંગ કરે છે અને ટૂલ્સનો ઉપયોગ કરે છે. તે કમિટ (commit) માં એક્શન્સ મોકલતું નથી. તે ચાલતી વખતે એક્શન્સ નક્કી કરે છે. જો તમે ફક્ત એપ્લિકેશન કોડની જ સમીક્ષા કરશો, તો તમે વાસ્તવિક જોખમ ચૂકી જશો.
એક એજન્ટ માત્ર કોડ નથી. તે રનટાઇમ કોન્ફિગરેશન (runtime configuration) છે. આ કોન્ફિગરેશનમાં નીચેનાનો સમાવેશ થાય છે:
• સિસ્ટમ પ્રોમ્પ્ટ (The system prompt) • હાર્નેસ અથવા લૂપ (The harness or loop) • ટૂલ સરફેસ (The tool surface) • મેમરી અને ઓળખ (Memory and identity) • નેટવર્ક એગ્રેસ પોલિસીઝ (Network egress policies) • કન્ટેનર ઈમેજીસ (Container images)
એક જ મોડેલનો ઉપયોગ કરતા બે એજન્ટ્સ આ સેટિંગ્સના આધારે અલગ રીતે વર્તી શકે છે. મોડેલ સ્થિર રહે છે. કોન્ફિગરેશન બધું જ બદલી નાખે છે.
ઘણી ટીમો સિસ્ટમ પ્રોમ્પ્ટ્સને સાદા ટેક્સ્ટ બોક્સ સેટિંગ્સ તરીકે ગણે છે. તેઓ ડેશબોર્ડમાં તેને એડિટ કરે છે. આ એક ભૂલ છે. એક જ લાઇનનો ફેરફાર ગાર્ડરેલ (guardrail) ને દૂર કરી શકે છે. એડિટેબલ પ્રોમ્પ્ટ એ એક અનરીવ્યુડ કોડ પાથ (unreviewed code path) છે.
વાસ્તવિક ઘટનાઓ આ સાબિત કરે છે:
• એક બોટે અઠવાડિયા સુધી મકાનમાલિકોને ગેરકાયદેસર સલાહ આપી. • પ્રોમ્પ્ટ અપડેટને કારણે સપોર્ટ બોટે ગ્રાહકોને ગાળો આપવાનું શરૂ કર્યું. • માલશિયસ ફાઇલોએ નિયમોને બાયપાસ કરવા માટે અદ્રશ્ય કેરેક્ટર્સનો ઉપયોગ કર્યો.
આ મોડેલની નિષ્ફળતા નહોતી. આ કોન્ફિગરેશનમાં થયેલા ફેરફારો હતા જેની કોઈએ સમીક્ષા કરી નહોતી.
તમારે કોન્ફિગરેશન સાથે કોડની જેમ વર્તવું જોઈએ.
તમારા સિસ્ટમ પ્રોમ્પ્ટ્સ અને હાર્નેસ કોન્ફિગ્સને વર્ઝન કંટ્રોલ (version control) માં રાખો. ફક્ત પુલ રિક્વેસ્ટ દ્વારા જ તેમાં ફેરફાર કરો. શું બદલાયું છે તે જોવા માટે 'diffs' નો ઉપયોગ કરો.
તમારા ડિપ્લોય કરેલા કોન્ફિગરેશન માટે કન્ટેન્ટ હેશ (content hash) નો ઉપયોગ કરો. આ હેશમાં પ્રોમ્પ્ટ વર્ઝન, મોડેલ ID અને કન્ટેનર ડાયજેસ્ટનો સમાવેશ થવો જોઈએ. જો તમે પ્રોમ્પ્ટ બદલો છો, તો એજન્ટની ઓળખ બદલાઈ જાય છે. તમે પ્રોમ્પ્ટને છૂપી રીતે બદલી શકતા નથી.
એજન્ટ સરફેસ પર ડ્રિફ્ટ ડિટેક્શન (drift detection) લાગુ કરો. ફક્ત હોસ્ટનું મોનિટરિંગ ન કરો. MCP સર્વર લિસ્ટ અને તે એજન્ટ માટેની ચોક્કસ એગ્રેસ પોલિસીઝનું મોનિટરિંગ કરો.
લોગિંગ કરતી વખતે, આ બે વસ્તુઓ ટ્રેક કરો:
• ડિસિઝન-ટાઇમ કોન્ટેક્સ્ટ સાઈઝ (Decision-time context size): જ્યારે એક્શન લેવામાં આવી ત્યારે મોડેલ પાસે કેટલી માહિતી હતી? • પેરેન્ટ પ્રોમ્પ્ટ (The parent prompt): મલ્ટી-એજન્ટ સિસ્ટમ્સમાં, કોલિંગ એજન્ટે શું મોકલ્યું હતું?
તમારે નવા સાધનોની જરૂર નથી. તમારા હાલના વર્ઝન કંટ્રોલ અને સ્ટ્રક્ચર્ડ લોગિંગનો ઉપયોગ કરો. તમારે ફક્ત તેમને યોગ્ય જગ્યાએ નિર્દેશિત કરવાની જરૂર છે.
શું તમે તમારા સિસ્ટમ પ્રોમ્પ્ટ્સનું વર્ઝનિંગ અને સમીક્ષા કરો છો? અથવા કોન્સોલ એક્સેસ ધરાવતી કોઈપણ વ્યક્તિ કોઈ પણ નિશાન વગર તેને બદલી શકે છે?
Optional learning community: https://t.me/GyaanSetuAi
