OpenAI เปิดตัว GPT-5.6 Sol เพื่อท้าชน Claude Mythos
OpenAI ได้เปิดตัว GPT-5.6 Sol อย่างเป็นทางการ ซึ่งเป็นโมเดลรุ่นใหม่ที่มีความซับซ้อนสูง โดยได้รับการออกแบบมาเพื่อครองตลาดในด้านการเขียนโค้ดแบบเอเจนต์ (agentic coding) และด้านความปลอดภัยทางไซเบอร์ แม้ว่าการเปิดตัวครั้งนี้จะถือเป็นก้าวกระโดดครั้งสำคัญในด้านความสามารถในการใช้เหตุผล แต่ก็เกิดขึ้นท่ามกลางข้อพิพาทที่กำลังก่อตัวขึ้นเกี่ยวกับระเบียบการเข้าถึงที่เข้มงวดของรัฐบาลสหรัฐฯ
สถาปัตยกรรมแบบแบ่งระดับใหม่เพื่อประสิทธิภาพและการขยายตัว
แทนที่จะเป็นการปล่อยโมเดลเดี่ยวๆ เหมือนที่ผ่านมา OpenAI ได้นำระบบการตั้งชื่อแบบแบ่งชั้นมาใช้ เพื่อตอบสนองความต้องการที่หลากหลายขององค์กร สถาปัตยกรรมนี้ใช้ชื่อ "Sol", "Terra" และ "Luna" เป็นระดับประสิทธิภาพแบบถาวร ซึ่งช่วยให้นักพัฒนาสามารถปรับขนาดการใช้งานได้ตามงบประมาณและความซับซ้อน
ในระดับสูงสุดของลำดับชั้นคือ Sol ซึ่งเป็นโมเดลเรือธง ถัดลงมาคือ Terra ที่มีประสิทธิภาพเทียบเท่ากับ GPT-5.5 ในราคาที่ถูกลงประมาณครึ่งหนึ่ง และ Luna ซึ่งเป็นระดับที่เน้นความคุ้มค่า สำหรับภาระงานที่มีความเข้มข้นสูง OpenAI ได้เปิดตัวโหมด "max" สำหรับการใช้เหตุผลเชิงลึก และโหมด "ultra" ซึ่งใช้ sub-agents ทำงานแบบขนานกันเพื่อจัดการกับงานที่ซับซ้อนและมีหลายแง่มุม
การสร้างมาตรฐานใหม่ในด้านการเขียนโค้ดและชีววิทยา
วัตถุประสงค์หลักของ GPT-5.6 Sol คือการก้าวข้ามโมเดลระดับ Claude Mythos ของ Anthropic ในด้านงานเขียนโค้ดแบบเอเจนต์ ตัวเลขต่างๆ ได้สนับสนุนคำกล่าวอ้างของ OpenAI โดยในเกณฑ์มาตรฐาน Terminal-Bench 2.1 นั้น Sol Ultra ทำคะแนนได้สูงถึง 91.9% ซึ่งแซงหน้า Claude Mythos 5 (88.0%) และ Gemini 3.1 Pro Preview ของ Google (70.7%)
โมเดลนี้ยังแสดงให้เห็นถึงความก้าวหน้าครั้งสำคัญในด้านวิทยาศาสตร์เฉพาะทาง โดยในเกณฑ์มาตรฐานด้านจีโนมิกส์ GeneBench v1 นั้น Sol ทำคะแนนได้ 30% ซึ่งเพิ่มขึ้นอย่างมากจาก 22% ที่ทำได้โดย GPT-5.5 และที่น่าสังเกตคือใช้จำนวน tokens น้อยกว่าด้วย ประสิทธิภาพนี้บ่งชี้ว่า OpenAI กำลังมุ่งเน้นไปที่การประมวลผลที่ "ฉลาดขึ้น" มากกว่าแค่การประมวลผลที่ "ใหญ่ขึ้น"
ความปลอดภัยทางไซเบอร์: ผู้ป้องกัน ปะทะ ผู้โจมตี
ในขอบเขตของความปลอดภัยทางไซเบอร์ Sol ตั้งเป้าที่จะเป็นเครื่องมือป้องกันชั้นนำ ในการทดสอบบน ExploitBench ซึ่งทดสอบความสามารถในการค้นหาและใช้ประโยชน์จากช่องโหว่ใน Google V8 JavaScript engine นั้น Sol มีประสิทธิภาพเทียบเท่ากับ Mythos Preview ของ Anthropic แต่มีข้อได้เปรียบที่สำคัญคือ ใช้จำนวน output tokens เพียงประมาณหนึ่งในสามเท่านั้น
OpenAI กำลังวางตำแหน่ง Sol ให้เป็นผู้ป้องกันมากกว่าจะเป็นผู้โจมตีแบบอัตโนมัติ ในการทดสอบที่เกี่ยวข้องกับ Chromium และ Firefox โมเดลสามารถระบุบั๊กและพื้นฐานการโจมตี (exploitation primitives) ได้สำเร็จ แต่หยุดลงก่อนที่จะสร้างการโจมตีแบบเต็มวงจร (full-chain exploit) โดยอัตโนมัติ ทั้งนี้ OpenAI ยืนยันว่า Sol ยังคงอยู่ในระดับที่ต่ำกว่าเกณฑ์ "Cyber Critical" ภายใต้กรอบการเตรียมความพร้อม (Preparedness Framework) ภายในของบริษัท
ข้อพิพาทเรื่องการควบคุมการเข้าถึงโดยรัฐบาล
การเปิดตัว GPT-5.6 Sol ไม่ได้ราบรื่นนัก ปัจจุบันการเข้าถึงถูกจำกัดไว้เพียงพันธมิตรที่ได้รับเลือกเพียงไม่กี่รายผ่าน API และ Codex ซึ่งเป็นข้อจำกัดที่กำหนดโดยรัฐบาลสหรัฐฯ เรื่องนี้เกิดขึ้นหลังจากที่รัฐบาลเคยตัดสินใจถอด Fable 5 ของ Anthropic ออกจากตลาดก่อนหน้านี้
OpenAI ได้แสดงความคัดค้านอย่างรุนแรงต่อข้อจำกัดเหล่านี้ โดยระบุว่ากระบวนการเข้าถึงของรัฐบาลในปัจจุบันนั้น "ไม่ยั่งยืน" บริษัทโต้แย้งว่าข้อจำกัดดังกล่าวขัดขวางไม่ให้นักพัฒนา องค์กร และผู้ป้องกันทางไซเบอร์สามารถเข้าถึงเครื่องมือที่จำเป็นต่อการรักษาความปลอดภัยโครงสร้างพื้นฐานดิจิทัลทั่วโลกได้
สรุปประเด็นสำคัญ
- กลยุทธ์โมเดลแบบแบ่งระดับ: OpenAI เปิดตัวลำดับชั้นใหม่ ได้แก่ Sol (เรือธง), Terra (ระดับกลาง) และ Luna (ระดับประหยัด) พร้อมกับโหมด "Ultra" สำหรับการทำงานแบบขนานด้วย sub-agent
- ความเป็นผู้นำในด้านเกณฑ์มาตรฐาน: GPT-5.6 Sol Ultra เป็นผู้นำในอุตสาหกรรมด้านการเขียนโค้ดแบบเอเจนต์ด้วยคะแนน 91.9% บน Terminal-Bench 2.1 ซึ่งมีประสิทธิภาพเหนือกว่า Claude Mythos และ Gemini อย่างมีนัยสำคัญ
- แนวทางที่เน้นประสิทธิภาพเป็นหลัก: Sol ให้ผลลัพธ์ที่แข่งขันได้ทั้งในด้านความปลอดภัยทางไซเบอร์และจีโนมิกส์ ในขณะที่ใช้จำนวน tokens น้อยลงอย่างมาก ซึ่งอาจช่วยลดต้นทุนที่มีประสิทธิภาพต่อภาระงานสำหรับนักพัฒนา
