യുഎസ് ഗവൺമെന്റ് നിരോധനത്തിന് ശേഷം Fable 5-ലേക്ക് ആഗോള പ്രവേശനം പുനഃസ്ഥാപിച്ചു Anthropic
യുഎസ് ഗവൺമെന്റിന്റെ നിർദ്ദേശപ്രകാരം രണ്ടാഴ്ചത്തെ സസ്പെൻഷന് ശേഷം, Anthropic തങ്ങളുടെ ഏറ്റവും ശക്തമായ AI മോഡലായ Fable 5-ന്റെ ആഗോള വിന്യാസം ഔദ്യോഗികമായി പുനരാരംഭിച്ചു. നിലവിലുള്ള സുരക്ഷാ നിയന്ത്രണങ്ങളെ മറികടക്കാൻ സഹായിക്കുന്ന ഒരു 'jailbreak' സുരക്ഷാ വീഴ്ച കണ്ടെത്തിയതിനെത്തുടർന്നാണ് ഈ നിരോധനം ഏർപ്പെടുത്തിയത്.
സുരക്ഷാ വീഴ്ച: പ്രതിരോധ ഗവേഷണത്തിൽ നിന്ന് സുരക്ഷാ ഭീഷണിയായി
Fable 5-ന്റെ സുരക്ഷാ പ്രോട്ടോക്കോളുകൾ വിജയകരമായി മറികടക്കാൻ സാധിച്ച Amazon ഗവേഷകരുടെ സുരക്ഷാ റിപ്പോർട്ടാണ് ഈ പെട്ടെന്നുള്ള നിയന്ത്രണത്തിന് കാരണമായത്. പ്രത്യേക സോഫ്റ്റ്വെയർ സുരക്ഷാ വീഴ്ചകൾ തിരിച്ചറിയാനും, ഒരു ശ്രദ്ധേയമായ സംഭവത്തിൽ അവ ചൂഷണം ചെയ്യുന്നതിനായി പ്രവർത്തനക്ഷമമായ കോഡ് നിർമ്മിക്കാനും ഈ മോഡലിന് കഴിയുമെന്ന് ഗവേഷകർ കണ്ടെത്തി.
പതിവ് പ്രതിരോധ സൈബർ സുരക്ഷാ പ്രവർത്തനങ്ങളുമായി ബന്ധപ്പെട്ട ഒരു "edge case" മാത്രമാണ് ഇതെന്നും Anthropic വ്യക്തമാക്കി. എങ്കിലും, ദുരുപയോഗം ചെയ്യപ്പെടാനുള്ള സാധ്യത കണക്കിലെടുത്ത് കമ്പനിയും യുഎസ് ഗവൺമെന്റ് ഏജൻസികളും സംയുക്തമായി അന്വേഷണം നടത്തേണ്ടി വന്നു. രസകരമായ വസ്തുത എന്തെന്നാൽ, ഈ പിഴവുകൾ തിരിച്ചറിയാനുള്ള കഴിവ് Fable 5-ന് മാത്രമുള്ളതല്ലെന്ന് അന്വേഷണത്തിൽ വ്യക്തമായി; Claude Opus 4.8, GPT-5.5, Kimi K2.7 എന്നിവയുൾപ്പെടെയുള്ള മറ്റ് മോഡലുകളും സമാനമായ കഴിവുകൾ പ്രകടിപ്പിച്ചിരുന്നു. Claude Haiku 4.5 പോലുള്ള ചെറിയ മോഡലുകൾ പോലും പരിശോധനയ്ക്കിടെ ഇതേ രീതിയിലുള്ള റിസൾട്ടുകൾ നൽകിയിരുന്നു.
പുതിയ സുരക്ഷാ ക്ലാസിഫയറുകൾ നടപ്പിലാക്കുന്നതും "False Positive" വെല്ലുവിളികളും
ഈ പ്രശ്നം പരിഹരിക്കുന്നതിനായി, Amazon റിപ്പോർട്ടിൽ കണ്ടെത്തിയ പ്രത്യേക ചൂഷണ രീതികളെ 99 ശതമാനത്തിലധികം കൃത്യതയോടെ തടയാൻ രൂപകൽപ്പന ചെയ്ത മെച്ചപ്പെട്ട ഒരു സുരക്ഷാ ക്ലാസിഫയർ Anthropic വിന്യസിച്ചിട്ടുണ്ട്. ഒരു ഉപയോക്താവിന്റെ അഭ്യർത്ഥന ഈ പുതിയ സുരക്ഷാ പാളിയെ ബാധിക്കുമ്പോൾ, അവർക്ക് ഒരു അറിയിപ്പ് ലഭിക്കുകയും ആ ചോദ്യം സ്വയമേവ പഴയതും കൂടുതൽ നിയന്ത്രണങ്ങളുള്ളതുമായ Claude Opus 4.8 മോഡലിലേക്ക് മാറ്റുകയും ചെയ്യുന്നു.
എന്നിരുന്നാലും, ഈ വർദ്ധിപ്പിച്ച സുരക്ഷ ഒരു പ്രവർത്തനപരമായ വില നൽകേണ്ടി വരുന്നുണ്ട്. സാധാരണ കോഡിംഗ്, ഡീബഗ്ഗിംഗ് ജോലികൾക്കിടയിൽ ഉപദ്രവകാരിയല്ലാത്ത അഭ്യർത്ഥനകളെപ്പോലും പുതിയ ക്ലാസിഫയർ അടയാളപ്പെടുത്താറുണ്ട് എന്ന് Anthropic സമ്മതിച്ചു. ഈ "safety margin" സുരക്ഷയും ഉപയോഗക്ഷമതയും തമ്മിലുള്ള ഒരു സംഘർഷം സൃഷ്ടിക്കുന്നു—അപകടകരമായ ഔട്ട്പുട്ടുകൾ തടയുന്നതിനായി നിയന്ത്രണങ്ങൾ ഏർപ്പെടുത്തുമ്പോൾ, ഡെവലപ്പർമാരുടെ നിയമാനുസൃതമായ ചോദ്യങ്ങൾ നിരസിക്കപ്പെടാൻ ഇത് കാരണമാകുന്നു. ഇത് അത്യാധുനിക AI മോഡലുകൾ വിന്യസിക്കുമ്പോൾ നേരിടുന്ന ഒരു പ്രധാന വെല്ലുവിളിയാണ്.
വ്യവസായ മാനദണ്ഡങ്ങൾക്കും ഗവൺമെന്റ് മേൽനോട്ടത്തിനുമുള്ള ശ്രമങ്ങൾ
Fable 5 സംഭവം വ്യവസായവ്യാപകമായ സുരക്ഷാ മാനദണ്ഡങ്ങൾ രൂപീകരിക്കുന്നതിനുള്ള Anthropic-ന്റെ ശ്രമങ്ങളെ വേഗത്തിലാക്കി. jailbreaks റേറ്റ് ചെയ്യുന്നതിനും ഏകീകൃത പ്രതിരോധ നടപടികൾ സ്വീകരിക്കുന്നതിനുമുള്ള ഒരു ചട്ടക്കൂട് നിർമ്മിക്കുന്നതിനായി കമ്പനി നിലവിൽ "Glasswing" പ്രോഗ്രാമിലൂടെ Amazon, Microsoft, Google എന്നിവരുമായി സഹകരിക്കുന്നുണ്ട്. ഇതിനെ ശക്തിപ്പെടുത്തുന്നതിനായി, Anthropic ഒരു പ്രത്യേക 24/7 മോണിറ്ററിംഗ് ടീമിനെയും സൈബർ സുരക്ഷാ ഗവേഷകരെ പ്രോത്സാഹിപ്പിക്കുന്നതിനായി പുതിയ HackerOne പ്രോഗ്രാമും ആരംഭിച്ചിട്ടുണ്ട്.
കൂടാതെ, എല്ലാ അത്യാധുനിക മോഡൽ ഡെവലപ്പർമാർക്കും ഒരുപോലെ ബാധകമായ "ശക്തമായ നിയന്ത്രണങ്ങൾക്കായി" (strong regulation) Anthropic വാദിക്കുന്നു. സുരക്ഷാപരമായ കാര്യങ്ങളിൽ അതീവ ശ്രദ്ധ വേണ്ട മോഡലുകൾ ഗവൺമെന്റ് പങ്കാളികൾക്ക് മുൻകൂട്ടി ലഭ്യമാക്കുന്നതിലൂടെയും സംയുക്ത ഗവേഷണത്തിനായി വലിയ തോതിൽ കമ്പ്യൂട്ടിംഗ് ശേഷി വിനിയോഗിക്കുന്നതിലൂടെയും, സുതാര്യവും ഗവൺമെന്റ് അംഗീകരിച്ചതുമായ AI മേൽനോട്ട സംവിധാനങ്ങളിലേക്കുള്ള പ്രസ്ഥാനത്തിൽ ഒരു നേതാവായി Anthropic സ്വയം അടയാളപ്പെടുത്തുന്നു.
പ്രധാന വിവരങ്ങൾ
- പുനഃസ്ഥാപിച്ച പ്രവേശനം: Claude.ai, Claude Code, Claude Cowork എന്നിവയിലൂടെ Fable 5 വീണ്ടും ലഭ്യമാണ്. Pro, Max, Team പ്ലാനുകൾക്ക് ജൂലൈ 7 വരെ പ്രവേശനം ലഭിക്കും.
- പുതിയ പ്രതിരോധ പാളികൾ: കണ്ടെത്തിയ ചൂഷണ രീതികളിൽ 99% തടയാൻ ശേഷിയുള്ള ഒരു സുരക്ഷാ ക്ലാസിഫയർ Anthropic നടപ്പിലാക്കി, എങ്കിലും ഇത് കോഡിംഗ് ജോലികളിൽ തെറ്റായ മുന്നറിയിപ്പുകൾ (false positives) വർദ്ധിപ്പിച്ചേക്കാം.
- സഹകരണാധിഷ്ഠിത സുരക്ഷ: അത്യാധുനിക മോഡലുകളിലെ jailbreaks നിരീക്ഷിക്കുന്നതിനും അവയോട് പ്രതികരിക്കുന്നതിനുമുള്ള പൊതുവായ വ്യവസായ മാനദണ്ഡങ്ങൾ സ്ഥാപിക്കുന്നതിനായി Anthropic പ്രമുഖ ടെക് കമ്പനികളുമായും യുഎസ് ഗവൺമെന്റുമായും പങ്കാളിയാവുന്നു.
