అమెరికా ప్రభుత్వ నిషేధం తర్వాత Fable 5 కి ప్రపంచవ్యాప్త ప్రాప్యతను పునరుద్ధరించిన Anthropic
అమెరికా ప్రభుత్వం విధించిన రెండు వారాల సస్పెన్షన్ తర్వాత, Anthropic తన అత్యంత శక్తివంతమైన AI మోడల్ అయిన Fable 5 యొక్క ప్రపంచవ్యాప్త విస్తరణను అధికారికంగా పునఃప్రారంభించింది. మోడల్ నిర్దేశించిన భద్రతా నియమాలను (safety guardrails) అధిగమించేలా చేసే 'జైల్బ్రేక్' (jailbreak) లోపం వల్ల కలిగిన కీలక భద్రతా అంశం కారణంగా ఈ నిషేధం విధించబడింది.
లోపం (Vulnerability): రక్షణ పరిశోధన నుండి భద్రతా ముప్పు వరకు
Fable 5 యొక్క భద్రతా ప్రోటోకాల్స్ను విజయవంతంగా అధిగమించిన Amazon పరిశోధకుల భద్రతా నివేదిక కారణంగా ఈ అకస్మాత్తు నిరోధం ఏర్పడింది. ఈ మోడల్ నిర్దిష్ట సాఫ్ట్వేర్ లోపాలను (vulnerabilities) గుర్తించగలదని మరియు ఒక సందర్భంలో, వాటిని దుర్వినియోగం చేయడానికి అవసరమైన ఫంక్షనల్ కోడ్ను కూడా రూపొందించగలదని పరిశోధకులు కనుగొన్నారు.
దీనిని సాధారణ రక్షణ సైబర్ సెక్యూరిటీ పనికి సంబంధించిన ఒక "ఎడ్జ్ కేస్" (edge case) గా Anthropic అభివర్ణించినప్పటికీ, దీని దుర్వినియోగం అయ్యే అవకాశం ఉండటంతో కంపెనీ మరియు అమెరికా ప్రభుత్వ సంస్థల మధ్య ఉమ్మడి దర్యాప్తు అవసరమైంది. ఆసక్తికరంగా, ఈ లోపాలను గుర్తించే సామర్థ్యం కేవలం Fable 5 కి మాత్రమే పరిమితం కాదని దర్యాప్తులో తేలింది; Claude Opus 4.8, GPT-5.5 మరియు Kimi K2.7 వంటి ఇతర మోడల్స్ కూడా ఇలాంటి సామర్థ్యాలను ప్రదర్శించాయి. Claude Haiku 4.5 వంటి చిన్న మోడల్స్ కూడా పరీక్షల సమయంలో ఇవే విధమైన ఎక్స్ప్లాయిట్ ఫలితాలను ఇచ్చాయి.
కొత్త సేఫ్టీ క్లాసిఫైయర్ల అమలు మరియు "ఫాల్స్ పాజిటివ్" (False Positive) సవాళ్లు
ఈ సమస్యను పరిష్కరించడానికి, Amazon నివేదికలో గుర్తించిన నిర్దిష్ట ఎక్స్ప్లాయిటేషన్ పద్ధతిని 99% కంటే ఎక్కువ ఖచ్చితత్వంతో అడ్డుకునేలా మెరుగుపరచబడిన సేఫ్టీ క్లాసిఫైయర్ను Anthropic మోహరించింది. వినియోగదారుని అభ్యర్థన ఈ కొత్త రక్షణ పొరను (defense layer) ప్రేరేపించినప్పుడు, వారికి నోటిఫికేషన్ అందుతుంది మరియు ఆ క్వెరీ ఆటోమేటిక్గా పాతది మరియు మరింత పరిమితమైన Claude Opus 4.8 మోడల్కు మళ్ళించబడుతుంది.
అయితే, ఈ మెరుగైన భద్రతతో పాటు కొన్ని పనిపరమైన ఇబ్బందులు కూడా ఉన్నాయి. సాధారణ కోడింగ్ మరియు డీబగ్గింగ్ పనుల సమయంలో, కొత్త క్లాసిఫైయర్ హాని లేని అభ్యర్థనలను కూడా తరచుగా ఫ్లాగ్ (flag) చేస్తోందని Anthropic అంగీకరించింది. ఈ "సేఫ్టీ మార్జిన్" దృఢత్వం (robustness) మరియు వినియోగయోగ్యత (usability) మధ్య ఉద్రిక్తతను సృష్టిస్తుంది—ప్రమాదకరమైన అవుట్పుట్లను నిరోధించడం వల్ల డెవలపర్ల చట్టబద్ధమైన క్వెరీలను తిరస్కరించే (refusals) సంఖ్య పెరగడం అనేది ఫ్రాంటియర్ మోడల్స్ విస్తరణలో ఎదురయ్యే ఒక పునరావృత సవాలు.
పరిశ్రమ ప్రమాణాలు మరియు ప్రభుత్వ పర్యవేక్షణ కోసం ప్రయత్నం
Fable 5 సంఘటన పరిశ్రమ అంతటా అధికారిక భద్రతా ప్రమాణాల కోసం Anthropic చేస్తున్న ప్రయత్నాన్ని వేగవంతం చేసింది. జైల్బ్రేక్లను రేటింగ్ చేయడానికి మరియు ప్రామాణిక ప్రతిచర్యలను (countermeasures) ప్రేరేపించడానికి ఒక ఫ్రేమ్వర్క్ను నిర్మించడానికి కంపెనీ ప్రస్తుతం "Glasswing" ప్రోగ్రామ్ ద్వారా Amazon, Microsoft మరియు Googleలతో కలిసి పనిచేస్తోంది. దీనిని బలోపేతం చేయడానికి, Anthropic సైబర్ సంబంధిత జైల్బ్రేక్లను నివేదించడానికి భద్రతా పరిశోధకులను ప్రోత్సహించేలా ఒక ప్రత్యేకమైన 24/7 మానిటరింగ్ టీమ్ను మరియు కొత్త HackerOne ప్రోగ్రామ్ను ప్రారంభించింది.
అంతేకాకుండా, అన్ని ఫ్రాంటియర్ మోడల్ డెవలపర్లకు సమానంగా వర్తించే "బలమైన నియంత్రణ" (strong regulation) కోసం Anthropic వాదిస్తోంది. భద్రతకు సంబంధించిన మోడల్లను విడుదల చేయడానికి ముందే ప్రభుత్వ భాగస్వాములకు అందుబాటులోకి తీసుకురావడం మరియు ఉమ్మడి పరిశోధన కోసం గణనీయమైన కంప్యూట్ (compute) వనరులను కేటాయించడం ద్వారా, పారదర్శకమైన మరియు ప్రభుత్వంతో అనుసంధానించబడిన AI పర్యవేక్షణ ఉద్యమంలో Anthropic తనను తాను ఒక నాయకుడిగా నిలబెట్టుకుంటోంది.
ముఖ్య అంశాలు
- పునరుద్ధరించబడిన ప్రాప్యత: Fable 5 మళ్లీ Claude.ai, Claude Code మరియు Claude Cowork ద్వారా అందుబాటులో ఉంది; Pro, Max మరియు Team ప్లాన్లకు జూలై 7 వరకు ప్రాప్యత లభిస్తుంది.
- కొత్త రక్షణ పొరలు: Anthropic ఒక సేఫ్టీ క్లాసిఫైయర్ను అమలు చేసింది, ఇది గుర్తించబడిన ఎక్స్ప్లాయిట్ పద్ధతిని 99% వరకు అడ్డుకుంటుంది, అయితే ఇది కోడింగ్ వర్క్ఫ్లోలలో ఫాల్స్ పాజిటివ్లను పెంచవచ్చు.
- సహకార భద్రత: ఫ్రాంటియర్ మోడల్ జైల్బ్రేక్లను పర్యవేక్షించడానికి మరియు వాటికి ప్రతిస్పందించడానికి ఉమ్మడి పరిశ్రమ ప్రమాణాలను నెలకొల్పడానికి Anthropic ప్రముఖ టెక్ సంస్థలు మరియు అమెరికా ప్రభుత్వంతో భాగస్వామ్యం కలిగి ఉంది.
