மல்டி-ஏஜென்ட் AI பாதுகாப்பு அபாயங்களைத் தீர்க்க Google DeepMind $10M நிதியுதவி அளிக்கிறது
AI ஏஜெண்டுகள் சாதாரண சாட்பாட்களிலிருந்து சிக்கலான பணிகளைச் செய்யக்கூடிய தன்னாட்சித் திறன் கொண்ட அமைப்புகளாகப் பரிணமிக்கும்போது, ஒரு புதிய வகை அமைப்பு ரீதியான அபாயம் உருவாகி வருகிறது. மில்லியன் கணக்கான இத்தகைய தன்னாட்சி ஏஜெண்டுகள் நிஜ உலகில் ஒன்றோடொன்று தொடர்பு கொள்ளத் தொடங்கும்போது ஏற்படும் கணிக்க முடியாத நடத்தைகளைப் பற்றி ஆய்வு செய்ய Google DeepMind மற்றும் பல உலகளாவிய கூட்டாளிகள் ஒரு பிரம்மாண்டமான முயற்சியைத் தொடங்கியுள்ளனர்.
மல்டி-ஏஜென்ட் சிக்கல்: தனிப்பட்ட மாடல் பாதுகாப்பிற்கு அப்பால்
தற்போதைய AI யுகத்தின் பெரும்பகுதியில், ஆராய்ச்சி என்பது தனிப்பட்ட மாடல்களின் பாதுகாப்பிலேயே கவனம் செலுத்தி வருகிறது—அதாவது ஒரு குறிப்பிட்ட LLM நச்சுத்தன்மை வாய்ந்த உள்ளடக்கத்தை வெளியிடாமல் அல்லது தீய கட்டளைகளை (malicious prompts) பின்பற்றாமல் இருப்பதை உறுதி செய்வதாகும். இருப்பினும், உண்மையான சவால் "மல்டி-ஏஜென்ட் அமைப்புகளில்" (multi-agent systems) தான் உள்ளது என்பதை Google DeepMind மற்றும் அதன் கூட்டாளிகள் உணர்ந்துள்ளனர்.
பொருளாதாரத்தின் பல்வேறு பகுதிகளில் அதிக எண்ணிக்கையிலான ஏஜெண்டுகள் பயன்படுத்தப்படும்போது, அவை ஒரு சிக்கலான சூழலை (ecosystem) உருவாக்குகின்றன; அங்கு அவற்றின் கூட்டு நடத்தை, தனித்தனி ஏஜெண்டுகளின் செயல்பாடுகளின் கூட்டுத்தொகையிலிருந்து முற்றிலும் மாறுபட்டதாக இருக்கலாம். இந்த "ஏஜென்ட் ஹைவ் மைண்ட்" (agent hive mind) என்பது உருவெழும் நுண்ணறிவை (emergent intelligence) உருவாக்கலாம் அல்லது இன்னும் அச்சமூட்டும் வகையில், உருவெழும் குழப்பங்களை (emergent chaos) உருவாக்கலாம். தனித்தனி மாடல்களை ஆய்வு செய்வதன் மூலம் இத்தகைய விளைவுகளைக் கணிக்க முடியாது என்று நிபுணர்கள் எச்சரிக்கின்றனர்; அதற்குப் பதிலாக, ஏஜெண்டுகள் டிஜிட்டல் சாண்ட்பாக்ஸ்களில் (digital sandboxes) எவ்வாறு ஒன்றோடொன்று தொடர்பு கொள்கின்றன, போட்டியிடுகின்றன அல்லது தற்செயலாக ஒத்துழைக்கின்றன என்பதைக் காண ஆராய்ச்சியாளர்கள் யதார்த்தமான, பெரிய அளவிலான உருவகப்படுத்துதல்களை (simulations) பயன்படுத்த வேண்டும்.
கல்விசார் ஆராய்ச்சிக்காக ஒரு $10 மில்லியன் கூட்டமைப்பு
இந்த இடைவெளியை நிரப்ப, ஆராய்ச்சியாளர்களுக்கு $10 மில்லியன் நிதியுதவி வழங்குவதற்காக Google DeepMind ஒரு வலுவான கூட்டமைப்பை உருவாக்கியுள்ளது. இந்த கூட்டமைப்பில் Schmidt Sciences (எரிக் மற்றும் வெண்டி ஸ்மிட் தலைமையிலான ஒரு அறக்கட்டளை), ARIA (UK அரசாங்கத்தின் மூன்ஷாட் ஏஜென்சி), Cooperative AI அறக்கட்டளை மற்றும் Google.org ஆகியவை அடங்கும்.
பெரிய தொழில்நுட்ப நிறுவனங்களின் ஆய்வகங்களுக்கு வெளியே, கல்வித்துறைக்குள் ஆராய்ச்சியை கொண்டு செல்வதே இதன் மூலோபாய இலக்காகும். Google மற்றும் Anthropic போன்ற தொழில்துறை தலைவர்கள் தொழில்நுட்பத்தை உருவாக்கி வரும் அதே வேளையில், கல்விசார் ஆராய்ச்சியாளர்களுக்கு எதிர்காலத்தைப் பற்றி ஆழமாகப் பார்க்கவும், வணிக ரீதியான தயாரிப்பு சுழற்சிகளுக்கு உடனடி முன்னுரிமையாக இல்லாத நீண்டகால அமைப்பு ரீதியான அபாயங்களை ஆராயவும் சுதந்திரம் உள்ளது. தற்போது இல்லாத "மல்டி-ஏஜென்ட் பாதுகாப்பு" (multi-agent safety) என்ற அடிப்படைத் துறையை உருவாக்குவதை இந்த நிதியுதவி நோக்கமாகக் கொண்டுள்ளது.
பிராம்ட் இன்ஜெக்ஷன்கள் முதல் டிஜிட்டல் அராஜகம் வரை
மல்டி-ஏஜென்ட் அமைப்புகளுடன் தொடர்புடைய அபாயங்கள் வெறும் தத்துவார்த்தமானவை மட்டுமல்ல; அவை ஏற்கனவே உள்ள சைபர் பாதுகாப்பு அச்சுறுத்தல்களின் தீவிரமான வடிவங்களாகும். முக்கிய கவலைகள் பின்வருமாறு:
- மேம்பட்ட பிராம்ட் இன்ஜெக்ஷன்கள் (Advanced Prompt Injections): ஒரு ஆவணத்தில் மறைந்துள்ள ஒரு தீங்கிழைக்கும் வாக்கியத்தால் ஒரு ஏஜென்ட் "ஹைஜாக்" (hijacked) செய்யப்படலாம், இது ஒரு பயனுள்ள உதவியாளரைத் தானாகவே இயங்கும் மால்வேராக (malware) மாற்றக்கூடும்.
- தானியங்கி மோசடிகள் மற்றும் சைபர் தாக்குதல்கள்: பகுத்தறிவு மற்றும் தன்னிச்சையாகச் செயல்படும் திறன் கொண்ட ஏஜென்ட்கள், சிக்கலான, பல படிநிலைகளைக் கொண்ட சமூகப் பொறியியல் (social engineering) அல்லது ஹேக்கிங் முயற்சிகளைப் பெரிய அளவில் செயல்படுத்த முடியும்.
- அமைப்பு ரீதியான நிலையற்ற தன்மை: மனித நிறுவனங்கள் எதிர்பாராத பொருளாதார மாற்றங்களை ஏற்படுத்துவது போலவே, தன்னாட்சி ஏஜென்ட்களின் (autonomous agents) பெருமளவிலான பயன்பாடு டிஜிட்டல் "அராஜகம்" அல்லது சந்தை நிலையற்ற தன்மைக்கு வழிவகுக்கக்கூடும்.
மனிதர்களால் எழுதப்பட்ட நிலையான பாதைகளைப் பின்பற்றும் பாரம்பரிய மென்பொருள்களைப் போலன்றி, AI ஏஜென்ட்கள் பகுத்தறிந்து தன்னிச்சையாகச் செயல்படுகின்றன. இந்தத் தற்செயலான தன்மை (unpredictability), "ஜீரோ டிரஸ்ட்" (zero trust) கட்டமைப்புகளை நோக்கி நகர வேண்டிய அவசியத்தை ஏற்படுத்துகிறது—இது Anthropic நிறுவனத்தால் ஆதரிக்கப்படும் ஒரு அணுகுமுறையாகும்—இதில் ஒவ்வொரு ஏஜென்ட்டும் ஒரு சாத்தியமான பாதிப்பாகவே (vulnerability) கருதப்படுகிறது.
முக்கியக் குறிப்புகள்
- புதிய நிதித் திட்டம்: ஒன்றிணைந்து செயல்படும் AI ஏஜென்ட்களின் கணிக்க முடியாத நடத்தைகள் குறித்த கல்விசார் ஆராய்ச்சிகளுக்கு நிதி வழங்குவதற்காக Google DeepMind மற்றும் அதன் கூட்டாளிகள் $10 மில்லியன் டாலர்களை உறுதி செய்துள்ளனர்.
- உருவாகும் அபாயங்கள்: மில்லியன் கணக்கான தன்னாட்சி ஏஜென்ட்கள், தானியங்கி சைபர் தாக்குதல்கள் மற்றும் "ஹைவ் மைண்ட்" (hive mind) போன்ற அமைப்பு ரீதியான அபாயங்களை உருவாக்கக்கூடும் என்பதே முதன்மையான கவலையாகும்; இவற்றைத் தனித்தனி மாடல்களைப் பரிசோதிப்பதன் மூலம் கணிக்க முடியாது.
- பாதுகாப்பு முன்மாதிரிகளில் மாற்றம்: ஏஜென்ட்கள் நிலையான மென்பொருள்களிலிருந்து பகுத்தறியும் அமைப்புகளாக மாறும் போது, ஹைஜாக் மற்றும் பிராம்ட் இன்ஜெக்ஷன் அபாயங்களைக் குறைக்கத் தொழில் துறை "ஜீரோ டிரஸ்ட்" (zero trust) மாதிரிகளை நோக்கி நகர்ந்து வருகிறது.