امریکی حکومت کی پابندی کے بعد Anthropic نے Fable 5 تک عالمی رسائی بحال کر دی

امریکی حکومت کے حکم پر دو ہفتوں کی معطلی کے بعد، Anthropic نے اپنے طاقتور ترین AI ماڈل Fable 5 کی عالمی سطح پر پیشکش (rollout) باضابطہ طور پر دوبارہ شروع کر دی ہے۔ یہ پابندی ایک اہم سیکیورٹی دریافت کے نتیجے میں لگی تھی جس میں ایک 'jailbreak' کی ایسی کمزوری سامنے آئی تھی جس نے ماڈل کو قائم شدہ حفاظتی حدود (safety guardrails) کو نظر انداز کرنے کی اجازت دے دی تھی۔

کمزوری: دفاعی تحقیق سے سیکیورٹی خطرے تک

یہ اچانک پابندی Amazon کے محققین کی ایک سیکیورٹی رپورٹ کے نتیجے میں لگی تھی جنہوں نے کامیابی سے Fable 5 کے حفاظتی پروٹوکولز کو عبور کر لیا تھا۔ محققین نے دریافت کیا کہ یہ ماڈل مخصوص سافٹ ویئر کی کمزوریوں کی نشاندہی کر سکتا ہے اور ایک اہم واقعے میں، ان کا فائدہ اٹھانے کے لیے فعال کوڈ (functional code) بھی تیار کر سکتا ہے۔

اگرچہ Anthropic نے اسے معمول کے دفاعی سائبر سیکیورٹی کام سے متعلق ایک "edge case" قرار دیا، لیکن غلط استعمال کے امکان نے کمپنی اور امریکی حکومتی ایجنسیوں کے درمیان مشترکہ تحقیقات کو ضروری بنا دیا۔ دلچسپ بات یہ ہے کہ تحقیقات سے یہ انکشاف ہوا کہ ان خامیوں کی نشاندہی کرنے کی صلاحیت صرف Fable 5 تک محدود نہیں تھی؛ دیگر ماڈلز، بشمول Claude Opus 4.8، GPT-5.5، اور Kimi K2.7 میں بھی اسی طرح کی صلاحیتیں دیکھی گئیں۔ یہاں تک کہ ٹیسٹنگ کے دوران Claude Haiku 4.5 جیسے چھوٹے ماڈلز نے بھی اسی طرح کے 'exploit' نتائج فراہم کیے۔

نئے حفاظتی کلاسیفائرز کا نفاذ اور "False Positive" کا توازن

اس مسئلے کے حل کے لیے، Anthropic نے ایک بہتر 'safety classifier' تعینات کیا ہے جسے Amazon کی رپورٹ میں نشاندہی کی گئی مخصوص 'exploitation technique' کو 99% سے زیادہ درستگی کے ساتھ روکنے کے لیے ڈیزائن کیا گیا ہے۔ جب صارف کی درخواست دفاع کی اس نئی تہہ کو متحرک کرتی ہے، تو انہیں ایک اطلاع (notification) موصول ہوتی ہے، اور وہ سوال خود بخود پرانے اور زیادہ محدود Claude Opus 4.8 ماڈل کی طرف بھیج دیا جاتا ہے۔

تاہم، اس بہتر سیکیورٹی کے ساتھ ایک عملی قیمت بھی وابستہ ہے۔ Anthropic نے اعتراف کیا ہے کہ نیا کلاسیفائر عام کوڈنگ اور ڈی بگنگ (debugging) کے کاموں کے دوران بے ضرر درخواستوں کو بھی زیادہ کثرت سے 'flag' کرنے لگتا ہے۔ یہ "حفاظتی مارجن" مضبوطی اور استعمال کے درمیان ایک کشمکش پیدا کرتا ہے—جو کہ 'frontier models' کی تعیناتی میں ایک بار بار آنے والا چیلنج ہے، جہاں خطرناک نتائج کو روکنے سے اکثر جائز ڈویلپر سوالات کے "مسترد" (refusals) ہونے کے امکانات بڑھ جاتے ہیں۔

صنعتی معیارات اور حکومتی نگرانی کے لیے کوششیں

Fable 5 کے واقعے نے Anthropic کی جانب سے باقاعدہ، صنعت گیر حفاظتی معیارات کے لیے کی جانے والی کوششوں کو تیز کر دیا ہے۔ کمپنی اس وقت "Glasswing" پروگرام کے ذریعے Amazon، Microsoft، اور Google کے ساتھ مل کر 'jailbreaks' کی درجہ بندی کرنے اور معیاری جوابی اقدامات (countermeasures) شروع کرنے کے لیے ایک فریم ورک تیار کر رہی ہے۔ اس کو مزید تقویت دینے کے لیے، Anthropic نے ایک وقف 24/7 مانیٹرنگ ٹیم اور ایک نیا HackerOne پروگرام شروع کیا ہے تاکہ سیکیورٹی محققین کو سائبر سے متعلقہ 'jailbreaks' کی رپورٹ کرنے کی ترغیب دی جا سکے۔

مزید برآں، Anthropic "مضبوط ریگولیشن" کی وکالت کر رہا ہے جو تمام 'frontier model' ڈویلپرز پر یکساں طور پر لاگو ہو۔ سیکیورٹی کے حساس ماڈلز تک حکومتی شراکت داروں کو ریلیز سے پہلے رسائی فراہم کر کے اور مشترکہ تحقیق کے لیے اہم 'compute' فراہم کرنے کا عہد کر کے، Anthropic خود کو شفاف اور حکومتی ہم آہنگ AI نگرانی کی تحریک میں ایک لیڈر کے طور پر پیش کر رہا ہے۔

اہم نکات

  • بحال شدہ رسائی: Fable 5 اب دوبارہ Claude.ai، Claude Code، اور Claude Cowork کے ذریعے دستیاب ہے، جبکہ Pro، Max، اور Team پلانز کو 7 جولائی تک رسائی حاصل ہوگی۔
  • دفاعی نئی تہیں: Anthropic نے ایک 'safety classifier' نافذ کیا ہے جو نشاندہی شدہ 'exploit technique' کے 99% حصے کو روک دیتا ہے، اگرچہ یہ کوڈنگ کے کاموں میں 'false positives' میں اضافہ کر سکتا ہے۔
  • مشترکہ سیکیورٹی: Anthropic 'frontier model jailbreaks' کی نگرانی اور ان کا جواب دینے کے لیے مشترکہ صنعتی معیارات قائم کرنے کے لیے بڑے ٹیک اداروں اور امریکی حکومت کے ساتھ شراکت داری کر رہا ہے۔