𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗜𝘀 𝗔 𝗦𝗲𝗰𝘂𝗿𝗶𝘁𝘆 𝗟𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆

2027 ആയപ്പോഴേക്കും, എന്റർപ്രൈസ് AI വിന്യാസങ്ങളിൽ (deployments) 40% പ്രോംപ്റ്റ് ഇൻജക്ഷൻ (prompt injection) അല്ലെങ്കിൽ ഏജന്റ് ഹൈജാക്കിംഗ് (agent hijack) സംഭവങ്ങൾക്ക് ഇരയാകും. 2025-ന്റെ തുടക്കത്തിൽ ഇത് 5 ശതമാനത്തിൽ താഴെ മാത്രമായിരുന്നു എന്നത് വലിയൊരു വർദ്ധനവാണ്.

ഓർക്കസ്ട്രേഷൻ ലെയർ (orchestration layer) ഏജന്റുകളെ ഉപയോഗപ്രദമാക്കുന്നു. എന്നാൽ അത് അവയെ ഒരു ലക്ഷ്യസ്ഥാനവുമാക്കുന്നു (target).

സിംഗപ്പൂരിലെ ഒരു ലോജിസ്റ്റിക്സ് കമ്പനിക്ക് അടുത്തിടെ 2.3 മില്യൺ ഡോളറിന്റെ നഷ്ടം സംഭവിച്ചു. ഒരു ആക്രമണകാരി ഒരു വ്യാജ കലണ്ടർ ഇൻവൈറ്റ് (malicious calendar invite) അയച്ചു. ഇത് ഒരു ഷെഡ്യൂളിംഗ് ഏജന്റിനെ പ്രേരിപ്പിക്കുകയും, resultingly CRM ഡാറ്റ ഒരു പുറത്തുള്ള ഇൻബോക്സിലേക്ക് അയക്കുകയും ചെയ്തു. മോഡലിൽ തെറ്റായ കോഡുകൾ ഒന്നുമുണ്ടായിരുന്നില്ല. അത് നിർദ്ദേശങ്ങൾ കൃത്യമായി പാലിച്ചു. ആർക്കിടെക്ചർ ആയിരുന്നു പ്രശ്നം.

ഏജന്റുകൾ വെറും ചാറ്റ്ബോട്ടുകൾ മാത്രമല്ല. അവ ഫയലുകൾ വായിക്കുകയും, API-കൾ വിളിക്കുകയും, ഇടപാടുകൾ (transactions) നടത്തുകയും ചെയ്യുന്ന ടൂളുകളാണ്. ഒരു റിക്വസ്റ്റ് വരികയും ഒരു റെസ്പോൺസ് പുറത്തേക്ക് പോകുകയും ചെയ്യുന്നു എന്ന രീതിയിലാണ് പരമ്പരാഗത സുരക്ഷാ മാതൃകകൾ പ്രവർത്തിക്കുന്നത്. എന്നാൽ ഏജന്റുകൾ ഈ മാതൃകയെ തകർക്കുന്നു.

ഒരു PDF സംഗ്രഹിക്കാനും (summarize) റീഫണ്ട് സമർപ്പിക്കാനും കഴിയുന്ന ഒരു ഏജന്റ് എന്നത് ഒരൊറ്റ റൺടൈമിൽ പ്രവർത്തിക്കുന്ന മൂന്ന് ആപ്പുകൾക്ക് തുല്യമാണ്. ഓരോ ടൂൾ കോളും (tool call) ഒരു റിസ്കാണ്. ഓരോ മെമ്മറി റൈറ്റും (memory write) ഒരു റിസ്കാണ്. ഓരോ ഇമെയിലോ ഡോക്യുമെന്റോ ഇപ്പോൾ എക്സിക്യൂട്ടബിൾ കോഡായി മാറുന്നു.

സുരക്ഷിതമായി നിർമ്മിക്കുന്നതിന് നിങ്ങൾക്ക് മൂന്ന് ലെയറുകൾ ആവശ്യമാണ്:

• ഐഡന്റിറ്റി (Identity): ഓരോ ടൂൾ കോളും ഉപയോക്താവിൽ നിന്ന് വ്യത്യസ്തമായ ഒരു ഐഡന്റിറ്റി కలిగిരിക്കണം. • പ്രൊവനൻസ് (Provenance): ഓരോ മെമ്മറി റൈറ്റിനും അത് എവിടെ നിന്ന് വന്നുവെന്ന് കാണിക്കുന്ന മെറ്റാഡാറ്റ ആവശ്യമാണ്. • ഇൻറ്റന്റ് (Intent): ഓരോ പ്ലാൻ സ്റ്റെപ്പിനും ഡൗൺസ്ട്രീം സിസ്റ്റങ്ങൾക്ക് പരിശോധിക്കാൻ കഴിയുന്ന ഒരു സൈൻ ചെയ്ത ഒബ്ജക്റ്റ് ആവശ്യമാണ്.

ഏജന്റുകളെ നേരിട്ട് പ്രൊഡക്ഷൻ API-കൾ വിളിക്കാൻ അനുവദിക്കരുത്. ഒരു മീഡിയേറ്റഡ് ടൂൾ ലെയർ (mediated tool layer) ഉപയോഗിക്കുക. ഈ ലെയർ നിങ്ങളുടെ പുതിയ ഫയർവാൾ ആയി പ്രവർത്തിക്കുന്നു. ഇത് ആർഗ്യുമെന്റുകൾ പരിശോധിക്കുകയും ഓരോ സെഷനും അനുമതികൾ പരിമിതപ്പെടുത്തുകയും ചെയ്യുന്നു.

നിങ്ങളുടെ ഏജന്റ് മെമ്മറി ശ്രദ്ധിക്കുക. ഏജന്റിന്റെ പെരുമാറ്റം കാലക്രമേണ മാറ്റുന്നതിനായി ആക്രമണകാരികൾ 'പോയിസൺഡ്' (poisoned) ഡോക്യുമെന്റുകളോ ഇമെയിലുകളോ ഉപയോഗിക്കുന്നു. മെമ്മറി-പോയിസണിംഗ് ആക്രമണങ്ങൾ ഓരോ വർഷവും 300% വർദ്ധിച്ചുകൊണ്ടിരിക്കുകയാണ്.

പല ടീമുകളും അവരുടെ നിലവിലെ പൈപ്പ്‌ലൈനുകളിൽ AI ത്രെറ്റ് മോഡലിംഗ് (threat modeling) ഉൾപ്പെടുത്തുന്നുണ്ട്. എന്നാൽ ഇത് മാത്രം പോരാ. ഏജന്റ് റൺടൈമിൽ തന്നെ സുരക്ഷ ഉറപ്പാക്കണം. ടൂൾ-കോൾ അനോമലിസുകൾ (tool-call anomalies) നിരീക്ഷിക്കുന്ന സംവിധാനം വെറും 19% സ്ഥാപനങ്ങളിൽ മാത്രമേയുള്ളൂ. ഭൂരിഭാഗവും ഏജന്റ് പെരുമാറ്റം തിരിച്ചറിയാൻ കഴിയാത്ത പഴയ ലോഗുകളെയാണ് ആശ്രയിക്കുന്നത്.

സിസ്റ്റം ആക്സസ് ഉള്ള ഒരു ജൂനിയർ ജീവനക്കാരനെപ്പോലെ നിങ്ങളുടെ ഏജന്റിനെ പരിഗണിക്കുക. ഒരു പുതിയ ജീവനക്കാരന് ആദ്യ ദിവസം തന്നെ നിങ്ങൾ ഫുൾ റൂട്ട് ആക്സസ് (full root access) നൽകില്ലല്ലോ. നിങ്ങളുടെ ഏജന്റുകളുടെ കാര്യത്തിലും അങ്ങനെ ചെയ്യരുത്.

മികച്ച ഡെമോകൾ കാണിക്കുന്നവരല്ല വിജയികൾ. ബാങ്കിംഗ് അല്ലെങ്കിൽ ഹെൽത്ത് കെയർ പോലുള്ള നിയന്ത്രിത വ്യവസായങ്ങളിൽ (regulated industries) ആറ് മാസത്തെ സുരക്ഷാ കാലതാമസമില്ലാതെ വിന്യസിക്കാൻ കഴിയുന്നവരായിരിക്കും വിജയികൾ.

നിങ്ങളുടെ സുരക്ഷാ ലെയറുകൾ ഇപ്പോൾ തന്നെ നിർമ്മിക്കുക. ഒരു സുരക്ഷാ വീഴ്ച (breach) ഉണ്ടായതിന് ശേഷം അവ പരിഹരിക്കാൻ ശ്രമിക്കരുത്.

Source: https://dev.to/yanoai/why-your-ai-agent-architecture-will-be-your-biggest-security-liability-by-2027-30la

ഐച്ഛികമായ പഠന കമ്മ്യൂണിറ്റി: https://t.me/GyaanSetuAi