அமெரிக்க அரசாங்கத் தடைக்குப் பிறகு Fable 5-க்கான உலகளாவிய அணுகலை Anthropic மீண்டும் வழங்குகிறது
அமெரிக்க அரசாங்கத்தால் விதிக்கப்பட்ட இரண்டு வார கால இடைநீக்கத்திற்குப் பிறகு, Anthropic தனது மிகவும் சக்திவாய்ந்த AI மாடலான Fable 5-ன் உலகளாவிய வெளியீட்டை அதிகாரப்பூர்வமாக மீண்டும் தொடங்கியுள்ளது. நிர்ணயிக்கப்பட்ட பாதுகாப்புத் தடைகளை (safety guardrails) மாடல் மீற அனுமதிக்கும் 'jailbreak' பாதிப்பு குறித்த ஒரு முக்கியமான பாதுகாப்புத் தகவலின் காரணமாக இந்தத் தடை விதிக்கப்பட்டது.
பாதிப்பு: பாதுகாப்பு ஆராய்ச்சி முதல் பாதுகாப்பு அபாயம் வரை
Fable 5-ன் பாதுகாப்பு நெறிமுறைகளை (safety protocols) வெற்றிகரமாக மீறிய Amazon ஆராய்ச்சியாளர்களின் பாதுகாப்பு அறிக்கையிலிருந்து இந்தத் திடீர் கட்டுப்பாடுகள் உருவானது. இந்த மாடலால் குறிப்பிட்ட மென்பொருள் பாதிப்புகளைக் கண்டறிய முடியும் என்பதையும், ஒரு குறிப்பிடத்தக்க நிகழ்வில், அவற்றைச் சுரண்டுவதற்கான (exploit) செயல்பாட்டு குறியீட்டை (functional code) உருவாக்க முடியும் என்பதையும் ஆராய்ச்சியாளர்கள் கண்டறிந்தனர்.
Anthropic இதை வழக்கமான பாதுகாப்பு சைபர் பாதுகாப்புப் பணிகளுடன் தொடர்புடைய ஒரு "edge case" என்று குறிப்பிட்டாலும், தவறாகப் பயன்படுத்தப்படலாம் என்ற சாத்தியக்கூறு காரணமாக, நிறுவனத்திற்கும் அமெரிக்க அரசாங்க முகமைகளுக்கும் இடையிலான கூட்டு விசாரணை அவசியமானது. சுவாரஸ்யமாக, இந்தத் தவறுகளைக் கண்டறியும் திறன் Fable 5-க்கு மட்டுமே உரியது அல்ல என்பதை விசாரணை வெளிப்படுத்தியது; Claude Opus 4.8, GPT-5.5 மற்றும் Kimi K2.7 உள்ளிட்ட பிற மாடல்களும் இதே போன்ற திறன்களைக் கொண்டிருந்தன. சோதனை காலத்தின் போது Claude Haiku 4.5 போன்ற சிறிய மாடல்களும் இதே போன்ற சுரண்டல் முடிவுகளைத் தந்தன.
புதிய பாதுகாப்பு வகைப்படுத்தல்களை (Safety Classifiers) செயல்படுத்துதல் மற்றும் "False Positive" சவால்கள்
இந்தப் பிரச்சினையைச் சரிசெய்ய, Amazon அறிக்கையில் கண்டறியப்பட்ட குறிப்பிட்ட சுரண்டல் நுட்பத்தைத் 99%-க்கும் அதிகமான துல்லியத்துடன் தடுக்கும் வகையில் மேம்படுத்தப்பட்ட ஒரு பாதுகாப்பு வகைப்படுத்தலை (safety classifier) Anthropic செயல்படுத்தியுள்ளது. ஒரு பயனரின் கோரிக்கை இந்த புதிய பாதுகாப்பு அடுக்கைத் தூண்டும்போது, அவர்களுக்கு ஒரு அறிவிப்பு அனுப்பப்படும், மேலும் அந்த வினவல் (query) தானாகவே பழைய மற்றும் அதிக கட்டுப்பாடுகளைக் கொண்ட Claude Opus 4.8 மாடலுக்கு மாற்றப்படும்.
இருப்பினும், இந்த மேம்படுத்தப்பட்ட பாதுகாப்பானது செயல்பாட்டு ரீதியான சவால்களையும் கொண்டு வருகிறது. வழக்கமான கோடிங் மற்றும் டீபக்கிங் (debugging) பணிகளின் போது, புதிய வகைப்படுத்திப் பாதிப்பற்ற கோரிக்கைகளையும் அடிக்கடி தவறாகக் கண்டறிந்து எச்சரிப்பதாக Anthropic ஒப்புக்கொண்டது. இந்த "பாதுகாப்பு வரம்பு" (safety margin), ஒரு மாடலின் உறுதித்தன்மைக்கும் (robustness) பயன்பாட்டிற்கும் (usability) இடையே ஒரு பதற்றத்தை உருவாக்குகிறது—இது frontier மாடல் பயன்பாட்டில் மீண்டும் மீண்டும் வரும் ஒரு சவாலாகும், ஏனெனில் ஆபத்தான வெளியீடுகளைத் தடுப்பது பெரும்பாலும் முறையான டெவலப்பர்களின் வினவல்களைத் "நிராகரிப்பதற்கே" (refusals) வழிவகுக்கிறது.
தொழில்முறைத் தரநிலைகள் மற்றும் அரசாங்கக் கண்காணிப்பிற்கான முயற்சி
Fable 5 சம்பவம், முறையான மற்றும் தொழில்முறை ரீதியான பாதுகாப்புத் தரநிலைகளுக்கான Anthropic-ன் முயற்சியை வேகப்படுத்தியுள்ளது. jailbreak-களைத் தரவரிசைப்படுத்தவும், தரப்படுத்தப்பட்ட எதிர்நடவடிக்கைகளைத் தூண்டவும் ஒரு கட்டமைப்பை உருவாக்க, நிறுவனம் தற்போது "Glasswing" திட்டத்தின் மூலம் Amazon, Microsoft மற்றும் Google ஆகியவற்றுடன் இணைந்து செயல்பட்டு வருகிறது. இதை வலுப்படுத்த, Anthropic ஒரு பிரத்யேக 24/7 கண்காணிப்புக் குழுவையும், சைபர் தொடர்பான jailbreak-களைப் புகாரளிக்க பாதுகாப்பு ஆராய்ச்சியாளர்களை ஊக்குவிப்பதற்காக ஒரு புதிய HackerOne திட்டத்தையும் தொடங்கியுள்ளது.
மேலும், அனைத்து frontier மாடல் உருவாக்குநர்களுக்கும் சமமாகப் பொருந்தக்கூடிய "வலுவான ஒழுங்குமுறை" (strong regulation) வேண்டும் என்று Anthropic வாதிட்டு வருகிறது. பாதுகாப்பு ரீதியாக முக்கியமான மாடல்களை வெளியீட்டிற்கு முன்பே அரசாங்கப் பங்காளர்களுக்கு அணுகல் வழங்குவதன் மூலமும், கூட்டு ஆராய்ச்சிக்காக கணிசமான கணினித் திறனை (compute) வழங்குவதன் மூலமும், வெளிப்படையான மற்றும் அரசாங்கத்துடன் இணைந்த AI கண்காணிப்பு இயக்கத்தில் தன்னை ஒரு தலைவராக Anthropic நிலைநிறுத்திக் கொள்கிறது.
முக்கியத் தகவல்கள்
- மீட்டெடுக்கப்பட்ட அணுகல்: Fable 5 இப்போது மீண்டும் Claude.ai, Claude Code மற்றும் Claude Cowork மூலம் கிடைக்கிறது; Pro, Max மற்றும் Team திட்டங்கள் ஜூலை 7 வரை அணுகலைப் பெறும்.
- புதிய பாதுகாப்பு அடுக்குகள்: Anthropic கண்டறியப்பட்ட சுரண்டல் நுட்பத்தில் 99%-ஐத் தடுக்கும் ஒரு பாதுகாப்பு வகைப்படுத்தலைச் செயல்படுத்தியுள்ளது, இருப்பினும் இது கோடிங் பணிகளில் false positives-ஐ அதிகரிக்கக்கூடும்.
- கூட்டுப் பாதுகாப்பு: frontier மாடல் jailbreak-களைக் கண்காணிப்பதற்கும் அவற்றிற்குப் பதிலளிப்பதற்கும் பொதுவான தொழில்முறைத் தரநிலைகளை நிறுவுவதற்கு Anthropic முக்கிய தொழில்நுட்ப நிறுவனங்கள் மற்றும் அமெரிக்க அரசாங்கத்துடன் இணைந்து செயல்படுகிறது.
