ഞാൻ Claude Code-ന് താക്കോലുകൾ നൽകി. ഒരു വേർമും (Worm) അത് ചെയ്തു.

AI കോഡിംഗ് ഏജന്റുകൾ ജയിലബ്രേക്ക് ചെയ്യപ്പെടുകയല്ല ചെയ്യുന്നത്. നിങ്ങൾ അവയെ എന്തിനുവേണ്ടിയാണോ നിർമ്മിച്ചത്, അത് തന്നെയാണ് അവ ചെയ്യുന്നത്. കമാൻഡുകൾ പ്രവർത്തിപ്പിക്കാൻ അവ നിങ്ങളുടെ ക്രെഡൻഷ്യലുകൾ ഉപയോഗിക്കുന്നു. പ്രശ്നം എന്തെന്നാൽ, അക്രമികൾക്ക് (attackers) ഇൻപുട്ട് നൽകാൻ സാധിക്കും എന്നതാണ്.

അടുത്തകാലത്തുണ്ടായ സുരക്ഷാ വീഴ്ചകൾ (vulnerabilities) ഇത് സംഭവിക്കുന്ന മൂന്ന് വ്യത്യസ്ത രീതികൾ കാണിക്കുന്നു.

ഇതിന്റെ കാതലായ പ്രശ്നം ലളിതമാണ്. ഒരു കോഡിംഗ് ഏജന്റ് ഡാറ്റയും കമാൻഡുകളും തമ്മിലുള്ള അതിർവരമ്പ് ഇല്ലാതാക്കുന്നു. ഒരു LLM നിർദ്ദേശങ്ങളെയും (instructions) പുറത്തുനിന്നുള്ള ഡാറ്റയെയും ഒരേപോലെ കാണുന്നു. നിങ്ങൾ പറയുന്നതും ലോകം ഏജന്റിനോട് പറയുന്നതും തമ്മിൽ യാതൊരു വേർതിരിവുമില്ല.

നിങ്ങളെ എങ്ങനെ സംരക്ഷിക്കാം:

നിങ്ങളുടെ AI ഏജന്റിനെ മറ്റ് ഉയർന്ന അധികാരമുള്ള പ്രോസസ്സുകൾ (high-privilege processes) പോലെ പരിഗണിക്കുക. അതിന് കർശനമായ അതിർവരമ്പുകൾ ആവശ്യമാണ്.

നിങ്ങൾ ഏജന്റുകളെ ഓട്ടോ-റൺ മോഡിൽ പ്രവർത്തിപ്പിക്കുന്നുണ്ടെങ്കിൽ, അത് എപ്പോൾ പ്രവർത്തിപ്പിക്കണം എന്നും എപ്പോൾ നിർത്തണം എന്നും നിങ്ങൾ എങ്ങനെ തീരുമാനിക്കും?

Source: https://dev.to/kkierii/i-gave-claude-code-the-keys-so-did-a-worm-34a4

Optional learning community: https://t.me/GyaanSetuAi