ผู้เชี่ยวชาญด้านความปลอดภัยไซเบอร์ประท้วงคำสั่งแบนโมเดล Fable และ Mythos ของ Anthropic โดยรัฐบาลสหรัฐฯ
กลุ่มพันธมิตรผู้เชี่ยวชาญด้านความปลอดภัยไซเบอร์ระดับแนวหน้าจำนวน 76 ท่าน กำลังส่งสัญญาณเตือนต่อคำสั่งควบคุมการส่งออกของรัฐบาลสหรัฐฯ เมื่อเร็วๆ นี้ ซึ่งมุ่งเป้าไปที่โมเดล AI ที่ล้ำสมัยที่สุดของ Anthropic โดยกลุ่มผู้เชี่ยวชาญโต้แย้งว่า การจำกัดการเข้าถึงเครื่องมือเหล่านี้เป็นการลดทอนขีดความสามารถของผู้ป้องกันทางดิจิทัลโดยไม่ตั้งใจ ในขณะที่ฝ่ายตรงข้ามยังคงพัฒนาต่อไปอย่างต่อเนื่อง
ความขัดแย้ง: ความมั่นคงแห่งชาติ กับ ขีดความสามารถในการป้องกัน
ความตึงเครียดเริ่มต้นขึ้นเมื่อรัฐบาลสหรัฐฯ ออกคำสั่งควบคุมการส่งออกสำหรับโมเดล Fable และ Mythos ของ Anthropic โดยอ้างถึงความกังวลด้านความมั่นคงแห่งชาติที่ไม่ได้เปิดเผยรายละเอียด เพื่อให้เป็นไปตามคำสั่งดังกล่าว Anthropic จึงได้ระงับการเข้าถึงโมเดลเหล่านี้ทั่วโลก
เดิมทีโมเดล Mythos ถูกออกแบบมาให้มีความสามารถระดับสูงในการค้นหาช่องโหว่ จนทำให้ในช่วงแรก Anthropic จำกัดการเข้าถึงไว้เพียงกลุ่มองค์กรที่ได้รับเลือกประมาณ 150 แห่งใน 15 ประเทศ ส่วน Fable ซึ่งเป็นเวอร์ชันสำหรับสาธารณะ ถูกตั้งใจให้มีมาตรการป้องกัน (guardrails) ที่เข้มงวดเพื่อป้องกันการนำไปใช้ในทางที่ผิดในด้านชีววิทยา เคมี และความปลอดภัยไซเบอร์ อย่างไรก็ตาม การแทรกแซงของรัฐบาลได้ส่งผลให้การนำเครื่องมืออันทรงพลังเหล่านี้ไปใช้งานสำหรับกลุ่มคนที่ได้รับมอบหมายให้ดูแลความปลอดภัยของอินเทอร์เน็ตต้องหยุดชะงักลง
ข้อพิพาทเรื่อง "Jailbreak" และรายงานจาก Amazon
Anthropic ระบุว่าคำสั่งจากทำเนียบขาวอาจมีต้นตอมาจากความกังวลเรื่อง "jailbreaking" หรือวิธีการที่ใช้เพื่อหลบเลี่ยงมาตรการป้องกันความปลอดภัย ซึ่งความกังวลนี้มีรายงานว่ามาจากรายงานวิจัยที่ไม่ได้เปิดเผยต่อสาธารณะโดยนักวิจัยของ Amazon
รายงานดังกล่าวระบุว่าผู้ใช้สามารถหลบเลี่ยงข้อจำกัดด้านความปลอดภัยของ Fable เพื่อเข้าถึงความสามารถในระดับเดียวกับ Mythos ได้ อย่างไรก็ตาม ผู้เชี่ยวชาญด้านความปลอดภัยไซเบอร์ ซึ่งรวมถึง Katie Moussouris (ผู้ก่อตั้ง Luta Security) โต้แย้งว่านี่คือความเข้าใจผิดอย่างรุนแรงเกี่ยวกับประโยชน์ของ AI โดย Moussouris ยืนยันว่า "jailbreak" ที่ถูกกล่าวถึงนั้น เป็นเพียงการที่โมเดลทำงานตามหน้าที่ที่ได้รับมอบหมาย นั่นคือการแก้ไขโค้ดโอเพนซอร์สที่มีช่องโหว่ที่ทราบกันอยู่แล้ว
ตามความเห็นของ Moussouris การสั่งให้ AI แก้ไขบั๊ก อธิบายวิธีการแก้ไข (patch) และเขียนชุดทดสอบ (test) ไม่ใช่การละเมิดความปลอดภัย แต่เป็น "วงจรการค้นหา แก้ไข และทดสอบ" (find, fix, and test loop) ซึ่งเป็นหัวใจสำคัญของความปลอดภัยเชิงป้องกันในยุคปัจจุบัน การพยายามปิดกั้นพฤติกรรมเหล่านี้จะส่งผลเสียอย่างร้ายแรงต่อความสามารถของโมเดลในการปกป้องซอฟต์แวร์
รายชื่อผู้ลงนามที่มีบทบาทสำคัญและผลกระทบต่ออุตสาหกรรม
The open letter is backed by heavyweights in the security community, including former Facebook security chief Alex Stamos, Bugcrowd founder Casey Ellis, and famed cryptographer Jon Callas. Their argument is centered on a critical imbalance: if defenders are denied access to cutting-edge LLMs while adversaries utilize unrestricted models, the global security posture weakens.
The experts also pointed out that the perceived vulnerability in Fable is not unique to Anthropic. The letter suggests that similar "vulnerabilities" could be replicated on OpenAI’s GPT-5.5, Anthropic’s own Claude Opus 4.8 and Sonnet, and even international models like Kimi 2.7.
The group is calling for a democratic, science-based regulatory process that relies on transparent research rather than broad, reactionary bans that may do more harm than good.
Key Takeaways
- Defensive Disarmament: Cybersecurity experts warn that banning Anthropic’s Fable and Mythos models strips defenders of essential tools needed to find and fix software vulnerabilities.
- Functionality vs. Security: Critics argue that the "jailbreaking" concerns raised by researchers confuse legitimate defensive coding tasks with malicious exploits.
- Call for Transparency: Industry leaders are demanding a scientific, democratic rule-making process for AI export controls to ensure regulations are targeted and effective.