Anthropic Yarejesha Ufikiaji wa Kimataifa wa Fable 5 Baada ya Marufuku ya Serikali ya Marekani
Anthropic imerejesha rasmi utoaji wa Fable 5 duniani kote, modeli yake yenye nguvu zaidi ya AI, kufuatia kusitishwa kwa wiki mbili kulikoamuliwa na serikali ya Marekani. Marufuku hiyo ilichochewa na ugunduzi muhimu wa usalama unaohusisha udhaifu wa jailbreak ulioruhusu modeli hiyo kukwepa vizuizi vya usalama vilivyowekwa.
Udhaifu: Kutoka Utafiti wa Kinga hadi Hatari ya Usalama
Kizuizi hicho cha ghafla kilitokana na ripoti ya usalama kutoka kwa watafiti wa Amazon ambao walifanikiwa kukwepa itifaki za usalama za Fable 5. Watafiti hao waligundua kuwa modeli hiyo inaweza kutambua udhaifu mahususi wa programu na, katika tukio moja la kutambulika, kutengeneza kodi inayofanya kazi ili kuutumia udhaifu huo.
Ingawa Anthropic ilielezea jambo hili kama "edge case" inayohusisha kazi za kawaida za ulinzi wa usalama wa mtandao, uwezekano wa matumizi mabaya ulihitaji uchunguzi wa pamoja kati ya kampuni hiyo na mashirika ya serikali ya Marekani. Kwa kushangaza, uchunguzi huo ulionyesha kuwa uwezo wa kutambua kasoro hizi haukuwa wa kipekee kwa Fable 5; modeli nyingine, zikiwemo Claude Opus 4.8, GPT-5.5, na Kimi K2.7, zilionyesha uwezo kama huo. Hata modeli ndogo kama Claude Haiku 4.5 zilitoa matokeo yale yale ya uvunjaji wakati wa majaribio.
Kuweka Mifumo Mpya ya Kupanga Usalama na Changamoto ya "False Positive"
Ili kurekebisha suala hilo, Anthropic imeweka mfumo ulioboreshwa wa kupanga usalama (safety classifier) ulioundwa kuzuia mbinu mahususi ya uvunjaji iliyobainishwa katika ripoti ya Amazon kwa usahihi wa zaidi ya 99%. Ombi la mtumiaji linapochochea tabaka hili jipya la ulinzi, mtumiaji hupokea taarifa, na swali hilo hupelekwa kiotomatiki kwenye modeli ya zamani zaidi na yenye vizuizi zaidi, Claude Opus 4.8.
Hata hivyo, usalama huu ulioboreshwa unakuja na gharama ya utendaji. Anthropic ilikiri kuwa mfumo mpya wa kupanga unazidi kuashiria maombi yasiyo na madhara mara kwa mara wakati wa kazi za kawaida za uandishi wa kodi na utatuzi wa makosa (debugging). "Nafasi hii ya usalama" inatengeneza mvutano kati ya uimara na uwezo wa kutumia—changamoto inayojirudia katika utoaji wa modeli za kisasa ambapo kuzuia matokeo hatari mara nyingi husababisha kuongezeka kwa "kukataa" kwa maswali halali ya watengenezaji.
Jitihada za Viwango vya Viwanda na Usimamizi wa Serikali
Tukio la Fable 5 limeharakisha jitihada za Anthropic za kuweka viwango rasmi vya usalama vya viwanda vyote. Kampuni hiyo kwa sasa inashirikiana na Amazon, Microsoft, na Google kupitia programu ya "Glasswing" ili kujenga mfumo wa kutathmini jailbreaks na kuchochea hatua madhubuti za kuzuia. Ili kuimarisha hili, Anthropic imezindua timu maalum ya ufuatiliaji ya saa 24/7 na programu mpya ya HackerOne ili kuwahamasisha watafiti wa usalama kuripoti jailbreaks zinazohusiana na usalama wa mtandao.
Zaidi ya hayo, Anthropic inapinga "kanuni kali" zinazotumika kwa usawa kwa watengenezaji wote wa modeli za kisasa. Kwa kuwapa washirika wa serikali ufikiaji wa modeli nyeti za usalama kabla ya kuzinduliwa na kutoa rasilimali kubwa za kompyuta kwa ajili ya utafiti wa pamoja, Anthropic inajiweka kama kiongozi katika harakati kuelekea usimamizi wa AI unao wazi na unaoendana na serikali.
Mambo Muhimu ya Kuzingatia
- Ufikiaji Uliorejeshwa: Fable 5 inapatikana tena kupitia Claude.ai, Claude Code, na Claude Cowork, huku mipango ya Pro, Max, na Team ikipata ufikiaji hadi Julai 7.
- Tabaka Mpya za Ulinzi: Anthropic imeweka mfumo wa kupanga usalama unaozuia 99% ya mbinu ya uvunjaji iliyobainishwa, ingawa inaweza kuongeza "false positives" katika michakato ya uandishi wa kodi.
- Usalama wa Ushirikiano: Anthropic inashirikiana na wachezaji wakuu wa teknolojia na serikali ya Marekani ili kuanzisha viwango vya pamoja vya viwanda kwa ajili ya ufuatiliaji na kuitikia jailbreaks za modeli za kisasa.
