AI એજન્ટ્સનો અઘરો ભાગ કામ કરવું નથી, પણ આયોજન (Planning) કરવું છે
કાર્યો કરવા માટે AI એજન્ટ બનાવવો સરળ છે. પરંતુ તે કાર્યોનું યોગ્ય આયોજન કરે તેવો એજન્ટ બનાવવો અઘરો છે.
મેં એક CLI બનાવ્યું છે જ્યાં તમે એક વાક્ય ટાઈપ કરો છો અને LLM તમારા વાસ્તવિક એકાઉન્ટ્સ પર એક્શન લે છે. હું બે મોડ્સનો ઉપયોગ કરું છું: Direct mode અને Plan mode.
Direct mode ઝડપ માટે છે. Plan mode સુરક્ષા માટે છે. Plan mode માં, એજન્ટ તમારા ડેટાને સ્પર્શ કરે તે પહેલાં તમને દરેક સ્ટેપ બતાવે છે.
મેં એક વિશ્વસનીય પ્લાનર (planner) કેવી રીતે બનાવ્યો તે અહીં છે:
• મગજને વિભાજિત કરો (Split the brain) એક જ એજન્ટ આયોજન (planning) અને અમલીકરણ (execution) બંને કરી શકતો નથી. પ્લાનિંગ એજન્ટ વિચારવા માંગે છે. એક્ઝિક્યુશન એજન્ટ કામ કરવા માંગે છે. મેં તેમને બે અલગ-અલગ સિસ્ટમ પ્રોમ્પ્ટ્સ સાથે બે અલગ એજન્ટ્સમાં વિભાજિત કર્યા છે. આનાથી તેઓ એકબીજા સાથે ટકરાતા અટકે છે.
• એજન્ટને આંખો આપો (Give the agent eyes) અનુમાન લગાવતો પ્લાનર જોખમી હોય છે. મારા પ્રથમ વર્ઝનમાં ધારણાઓના આધારે પ્લાન બનાવવામાં આવતા હતા. હવે, પ્લાનર તમારા ડેટાનું સંશોધન કરવા માટે સૌ પ્રથમ read-only ટૂલ્સનો ઉપયોગ કરે છે. તે એક પણ સ્ટેપ લખતા પહેલા તમારા વાસ્તવિક Salesforce ફીલ્ડ્સ તપાસે છે.
• જવાબો પહેલેથી ભરી દો (Prefill the answers) એજન્ટ્સ ઘણીવાર ખોટા પ્રશ્નો પૂછે છે. જો તેઓ ઘણા બધા પ્રશ્નો પૂછે, તો અંતે તમારે તેમના માટે કામ કરવું પડે છે. મેં આ બદલી નાખ્યું છે. પ્લાનર હજુ પણ પ્રશ્નો પૂછે છે, પરંતુ તે એક સૂચિત જવાબ (recommended answer) પણ આપે છે. તમારે ફક્ત તેને કન્ફર્મ કરવાનું અથવા થોડો સુધારો કરવાનો હોય છે. આનાથી મેન્યુઅલ ડેટા એન્ટ્રી વગર પ્લાન સચોટ રહે છે.
• માત્ર યાદી નહીં, પણ સંદર્ભ (context) પણ આપો જો તમે એક્ઝિક્યુટરને માત્ર સ્ટેપ્સની યાદી આપો છો, તો તે તેની પાછળનું કારણ (reasoning) ગુમાવી દે છે. મેં પ્લાનરને સ્ટેપ્સની સાથે ધારણાઓ અને જોખમો પણ મોકલવા માટે સેટ કર્યું છે. હવે એક્ઝિક્યુટર દરેક એક્શન પાછળનું "કેમ" (why) જાણે છે.
• જોખમને લેબલ કરો (Label the danger) પ્લાન ત્યારે જ સુરક્ષિત છે જો તમે જોખમો જોઈ શકતા હોવ. મારું સિસ્ટમ ડિલીટ કરવા અથવા નામ બદલવા જેવા વિનાશક (destructive) કાર્યોને માર્ક કરે છે. જ્યારે એજન્ટ કોઈ વિનાશક સ્ટેપ પર પહોંચે છે, ત્યારે તે અટકી જાય છે અને તમને પૂછે છે.
• ડેટાનો ઉપયોગ નિર્ણાયક તરીકે કરો (Use data as the tiebreaker) જો એજન્ટને લાગે કે કોઈ સ્ટેપ નિષ્ફળ ગયું છે અને તમે તેને ફરીથી પ્રયાસ કરવા કહો છો, તો તે માત્ર આંધળું પાલન કરતું નથી. તે વાસ્તવિક પ્લેટફોર્મ ડેટા તપાસે છે. જો ડેટા દર્શાવે છે કે કાર્ય પહેલેથી જ પૂર્ણ થઈ ગયું છે, તો એજન્ટ તમારા દાવા કરતા ડેટા પર વધુ વિશ્વાસ રાખે છે.
સુરક્ષા વિશેની સત્યતા: Plan mode પ્રોમ્પ્ટ ઇન્જેક્શન (prompt injection) અથવા જો કોઈ યુઝર જોયા વગર "approve" પર ક્લિક કરે તેને રોકી શકતું નથી. તે જવાબદારી "મોડેલ પર વિશ્વાસ રાખવા" માંથી બદલીને "રિવ્યુ કરવા માટે માણસ પર વિશ્વાસ રાખવા" માં ખસેડે છે.
માળખું ગાર્ડરેલ્સ (guardrails) પૂરા પાડે છે, પરંતુ તમારું રિવ્યુ અંતિમ સુરક્ષા પૂરી પાડે છે.
Optional learning community: https://t.me/GyaanSetuAi
