અમેરિકન સરકારના પ્રતિબંધ બાદ Anthropic એ Fable 5 માટે વૈશ્વિક એક્સેસ પુનઃસ્થાપિત કર્યો
અમેરિકન સરકાર દ્વારા નિર્ધારિત બે અઠવાડિયાના સસ્પેન્શન પછી, Anthropic એ તેના સૌથી શક્તિશાળી AI મોડેલ, Fable 5 ના વૈશ્વિક રોલઆઉટને સત્તાવાર રીતે ફરી શરૂ કર્યું છે. આ પ્રતિબંધ એક ગંભીર સુરક્ષા શોધને કારણે લાગુ કરવામાં આવ્યો હતો, જેમાં 'જેલબ્રેક' (jailbreak) નબળાઈ સામેલ હતી, જેના કારણે મોડેલ સ્થાપિત સુરક્ષા ગાર્ડરેલ્સને બાયપાસ કરી શકતું હતું.
નબળાઈ: સંરક્ષણાત્મક સંશોધનથી સુરક્ષા જોખમ સુધી
આ અચાનક પ્રતિબંધ Amazon ના સંશોધકોના સુરક્ષા અહેવાલમાંથી ઉદભવ્યો હતો, જેમણે Fable 5 ના સુરક્ષા પ્રોટોકોલને સફળતાપૂર્વક બાયપાસ કર્યા હતા. સંશોધકોએ શોધી કાઢ્યું હતું કે મોડેલ ચોક્કસ સોફ્ટવેર નબળાઈઓને ઓળખી શકે છે અને એક નોંધપાત્ર કિસ્સામાં, તેનો ઉપયોગ કરવા માટે કાર્યરત કોડ (functional code) પણ બનાવી શકે છે.
જોકે Anthropic એ આને રૂટિન સંરક્ષણાત્મક સાયબર સુરક્ષા કાર્ય સાથે સંકળાયેલ "એજ કેસ" (edge case) તરીકે વર્ણવ્યો હતો, પરંતુ દુરુપયોગની સંભાવનાને કારણે કંપની અને અમેરિકન સરકારી એજન્સીઓ વચ્ચે સંયુક્ત તપાસની જરૂરિયાત ઊભી થઈ હતી. રસપ્રદ વાત એ છે કે, તપાસમાં બહાર આવ્યું હતું કે આ ખામીઓને ઓળખવાની ક્ષમતા માત્ર Fable 5 પૂરતી મર્યાદિત નહોતી; Claude Opus 4.8, GPT-5.5 અને Kimi K2.7 સહિતના અન્ય મોડેલોમાં પણ સમાન ક્ષમતાઓ જોવા મળી હતી. Claude Haiku 4.5 જેવા નાના મોડેલોએ પણ પરીક્ષણ દરમિયાન સમાન એક્સપ્લોઇટ (exploit) પરિણામો આપ્યા હતા.
નવા સેફ્ટી ક્લાસિફાયર્સનો અમલ અને "ફોલ્સ પોઝિટિવ" (False Positive) ટ્રેડ-ઓફ
આ સમસ્યાના નિવારણ માટે, Anthropic એ એક સુધારેલ સેફ્ટી ક્લાસિફાયર તૈનાત કર્યું છે, જે Amazon ના અહેવાલમાં ઓળખવામાં આવેલી ચોક્કસ એક્સપ્લોઇટેશન ટેકનિકને 99% થી વધુ ચોકસાઈ સાથે બ્લોક કરવા માટે ડિઝાઇન કરવામાં આવ્યું છે. જ્યારે વપરાશકર્તાની વિનંતી આ સંરક્ષણના નવા સ્તરને ટ્રિગર કરે છે, ત્યારે તેમને સૂચના મળે છે, અને ક્વેરી આપમેળે જૂના અને વધુ પ્રતિબંધિત Claude Opus 4.8 મોડેલ પર રીરૂટ કરવામાં આવે છે.
જોકે, આ વધારાની સુરક્ષા સાથે કાર્યક્ષમતામાં ઘટાડો પણ થાય છે. Anthropic એ સ્વીકાર્યું છે કે નવું ક્લાસિફાયર સ્ટાન્ડર્ડ કોડિંગ અને ડીબગિંગ કાર્યો દરમિયાન નિર્દોષ વિનંતીઓને પણ વારંવાર ફ્લેગ કરે છે. આ "સેફ્ટી માર્જિન" મજબૂતી અને ઉપયોગિતા વચ્ચે તણાવ પેદા કરે છે—જે ફ્રન્ટિયર મોડેલ ડિપ્લોયમેન્ટમાં એક વાર ફરી આવતી પડકારજનક સમસ્યા છે, જ્યાં જોખમી આઉટપુટને રોકવાથી ઘણીવાર કાયદેસરની ડેવલપર ક્વેરીઝના "અસ્વીકાર" (refusals) માં વધારો થાય છે.
ઉદ્યોગના ધોરણો અને સરકારી દેખરેખ માટે પ્રયાસો
Fable 5 ની ઘટનાએ ઉદ્યોગ-વ્યાપી ઔપચારિક સુરક્ષા ધોરણો માટે Anthropic ના પ્રયાસોને વેગ આપ્યો છે. કંપની હાલમાં "Glasswing" પ્રોગ્રામ દ્વારા Amazon, Microsoft અને Google સાથે મળીને જેલબ્રેક્સને રેટિંગ આપવા અને પ્રમાણિત પ્રતિનાત્મક પગલાં (countermeasures) લેવા માટેનું એક માળખું તૈયાર કરી રહી છે. આને મજબૂત કરવા માટે, Anthropic એ સાયબર સંબંધિત જેલબ્રેક્સ રિપોર્ટ કરવા માટે સુરક્ષા સંશોધકોને પ્રોત્સાહિત કરવા માટે એક સમર્પિત 24/7 મોનિટરિંગ ટીમ અને નવો HackerOne પ્રોગ્રામ શરૂ કર્યો છે.
વધુમાં, Anthropic તમામ ફ્રન્ટિયર મોડેલ ડેવલપર્સ માટે સમાન રીતે લાગુ પડતા "મજબૂત નિયમન" (strong regulation) ની હિમાયત કરી રહ્યું છે. સરકારી ભાગીદારોને સુરક્ષા-સંવેદનશીલ મોડેલ્સ માટે પ્રી-રિલીઝ એક્સેસ આપીને અને સંયુક્ત સંશોધન માટે નોંધપાત્ર કમ્પ્યુટ (compute) ફાળવીને, Anthropic પારદર્શક અને સરકારી-સુસંગત AI દેખરેખ તરફના આંદોલનમાં પોતાને એક લીડર તરીકે સ્થાપિત કરી રહ્યું છે.
મુખ્ય મુદ્દાઓ
- પુનઃસ્થાપિત એક્સેસ: Fable 5 ફરીથી Claude.ai, Claude Code, અને Claude Cowork દ્વારા ઉપલબ્ધ છે, જેમાં Pro, Max, અને Team પ્લાન્સને 7 જુલાઈ સુધી એક્સેસ મળશે.
- નવા સંરક્ષણ સ્તરો: Anthic એ એક સેફ્ટી ક્લાસિફાયર અમલમાં મૂક્યું છે જે ઓળખાયેલ એક્સપ્લોઇટ ટેકનિકના 99% ભાગને બ્લોક કરે છે, જોકે તે કોડિંગ વર્કફ્લોમાં 'ફોલ્સ પોઝિટિવ' વધારી શકે છે.
- સહયોગી સુરક્ષા: Anthropic ફ્રન્ટિયર મોડેલ જેલબ્રેક્સનું મોનિટરિંગ કરવા અને તેના પ્રતિભાવ આપવા માટે સહિયારા ઉદ્યોગ ધોરણો સ્થાપિત કરવા માટે મુખ્ય ટેક કંપનીઓ અને અમેરિકન સરકાર સાથે ભાગીદારી કરી રહ્યું છે.
