মার্কিন সরকারি নিষেধাজ্ঞার পর Anthropic পুনরায় Fable 5-এর বিশ্বব্যাপী অ্যাক্সেস চালু করল
মার্কিন সরকারের নির্দেশিত দুই সপ্তাহের স্থগিতাদেশের পর, Anthropic আনুষ্ঠানিকভাবে তাদের সবচেয়ে শক্তিশালী AI মডেল Fable 5-এর বিশ্বব্যাপী রোলআউট পুনরায় শুরু করেছে। একটি 'জেলব্রেক' (jailbreak) দুর্বলতা সংক্রান্ত গুরুতর নিরাপত্তা সংক্রান্ত তথ্যের কারণে এই নিষেধাজ্ঞা জারি করা হয়েছিল, যা মডেলটিকে নির্ধারিত নিরাপত্তা সুরক্ষা ব্যবস্থা (safety guardrails) লঙ্ঘন করতে সাহায্য করেছিল।
দুর্বলতা: রক্ষণাত্মক গবেষণা থেকে নিরাপত্তা ঝুঁকি
এই আকস্মিক বিধিনিষেধটি Amazon গবেষকদের একটি নিরাপত্তা প্রতিবেদনের সূত্র ধরে এসেছে, যারা সফলভাবে Fable 5-এর নিরাপত্তা প্রোটোকলগুলো বাইপাস করতে সক্ষম হয়েছিলেন। গবেষকরা দেখতে পান যে, মডেলটি নির্দিষ্ট সফটওয়্যার দুর্বলতাগুলো শনাক্ত করতে পারে এবং একটি উল্লেখযোগ্য ক্ষেত্রে, সেগুলোকে কাজে লাগানোর জন্য কার্যকর কোডও তৈরি করতে পারে।
যদিও Anthropic এটিকে রুটিন রক্ষণাত্মক সাইবার নিরাপত্তা কাজের একটি "এজ কেস" (edge case) হিসেবে বর্ণনা করেছে, তবে এর অপব্যবহারের সম্ভাবনা কোম্পানি এবং মার্কিন সরকারি সংস্থাগুলোর মধ্যে একটি যৌথ তদন্তের প্রয়োজনীয়তা তৈরি করেছে। মজার বিষয় হলো, তদন্তে দেখা গেছে যে এই ত্রুটিগুলো শনাক্ত করার ক্ষমতা কেবল Fable 5-এর মধ্যেই সীমাবদ্ধ ছিল না; Claude Opus 4.8, GPT-5.5 এবং Kimi K2.7 সহ অন্যান্য মডেলগুলোতেও একই ধরনের সক্ষমতা দেখা গেছে। এমনকি পরীক্ষার সময় Claude Haiku 4.5-এর মতো ছোট মডেলগুলোও একই ধরনের এক্সপ্লয়েট (exploit) ফলাফল প্রদর্শন করেছে।
নতুন সেফটি ক্লাসিফায়ার প্রয়োগ এবং "ফলস পজিটিভ"-এর ভারসাম্যহীনতা
সমস্যাটি সমাধানের জন্য, Anthropic একটি উন্নত সেফটি ক্লাসিফায়ার (safety classifier) মোতায়েন করেছে যা Amazon রিপোর্টে শনাক্ত করা নির্দিষ্ট এক্সপ্লয়েট কৌশলটিকে ৯৯%-এর বেশি নির্ভুলতার সাথে ব্লক করতে ডিজাইন করা হয়েছে। যখন কোনো ব্যবহারকারীর অনুরোধ এই নতুন প্রতিরক্ষা স্তরটিকে ট্রিগার করে, তখন তারা একটি নোটিফিকেশন পান এবং সেই কুয়েরিটি স্বয়ংক্রিয়ভাবে পুরনো এবং আরও সীমাবদ্ধ Claude Opus 4.8 মডেলে রিরাউট করা হয়।
তবে, এই বর্ধিত নিরাপত্তার একটি কার্যকরী মূল্য রয়েছে। Anthropic স্বীকার করেছে যে, নতুন ক্লাসিফায়ারটি সাধারণ কোডিং এবং ডিবাগিং কাজের সময় ক্ষতিকারক নয় এমন অনুরোধগুলোকেও অনেক সময় ভুলভাবে চিহ্নিত (flag) করে। এই "নিরাপত্তা মার্জিন" (safety margin) স্থায়িত্ব এবং ব্যবহারযোগ্যতার মধ্যে একটি টানাপোড়েন তৈরি করে—যা ফ্রন্টিয়ার মডেল স্থাপনের ক্ষেত্রে একটি পুনরাবৃত্ত চ্যালেঞ্জ, যেখানে বিপজ্জনক আউটপুট রোধ করতে গিয়ে প্রায়শই বৈধ ডেভেলপার কুয়েরিগুলোও "প্রত্যাখ্যান" (refusals) করতে হয়।
শিল্প মানদণ্ড এবং সরকারি তদারকির জন্য প্রচেষ্টা
Fable 5-এর ঘটনাটি আনুষ্ঠানিক এবং শিল্প-ব্যাপী নিরাপত্তা মানদণ্ডের জন্য Anthropic-এর প্রচেষ্টাকে ত্বরান্বিত করেছে। কোম্পানিটি বর্তমানে "Glasswing" প্রোগ্রামের মাধ্যমে Amazon, Microsoft এবং Google-এর সাথে সহযোগিতা করছে যাতে জেলব্রেক রেটিং এবং মানসম্মত পাল্টা ব্যবস্থা গ্রহণের জন্য একটি কাঠামো তৈরি করা যায়। এটিকে আরও শক্তিশালী করতে, Anthropic একটি নিবেদিত ২৪/৭ মনিটরিং টিম এবং সাইবার-সম্পর্কিত জেলব্রেক রিপোর্ট করার জন্য নিরাপত্তা গবেষকদের উৎসাহিত করতে একটি নতুন HackerOne প্রোগ্রাম চালু করেছে।
তদুপরি, Anthropic সমস্ত ফ্রন্টিয়ার মডেল ডেভেলপারদের জন্য সমানভাবে প্রযোজ্য "শক্তিশালী নিয়ন্ত্রণ" (strong regulation)-এর পক্ষে কথা বলছে। সরকারি অংশীদারদের নিরাপত্তা-সংবেদনশীল মডেলগুলোর প্রি-রিলিজ অ্যাক্সেস প্রদান এবং যৌথ গবেষণার জন্য উল্লেখযোগ্য কম্পিউট (compute) প্রদানের মাধ্যমে, Anthropic নিজেকে স্বচ্ছ এবং সরকারি-সমন্বিত AI তদারকির আন্দোলনের একজন নেতা হিসেবে প্রতিষ্ঠিত করছে।
মূল বিষয়সমূহ
- পুনরুদ্ধারকৃত অ্যাক্সেস: Fable 5 এখন পুনরায় Claude.ai, Claude Code এবং Claude Cowork-এর মাধ্যমে উপলব্ধ, যেখানে Pro, Max এবং Team প্ল্যানগুলো ৭ জুলাই পর্যন্ত অ্যাক্সেস পাবে।
- নতুন প্রতিরক্ষা স্তর: Anthropic একটি সেফটি ক্লাসিফায়ার প্রয়োগ করেছে যা শনাক্তকৃত এক্সপ্লয়েট কৌশলের ৯৯% ব্লক করে, যদিও এটি কোডিং ওয়ার্কফ্লোতে 'ফলস পজিটিভ' বৃদ্ধি করতে পারে।
- সহযোগিতামূলক নিরাপত্তা: ফ্রন্টিয়ার মডেল জেলব্রেক পর্যবেক্ষণ এবং মোকাবিলা করার জন্য একটি সাধারণ শিল্প মানদণ্ড স্থাপনে Anthropic প্রধান প্রযুক্তি প্রতিষ্ঠান এবং মার্কিন সরকারের সাথে অংশীদারিত্ব করছে।
