Google DeepMind สนับสนุนเงินทุน 10 ล้านดอลลาร์ เพื่อแก้ไขความเสี่ยงด้านความปลอดภัยของ AI แบบหลายเอเจนต์ (Multi-Agent)
ในขณะที่เอเจนต์ AI (AI agents) กำลังวิวัฒนาการจากแชทบอทธรรมดาไปสู่หน่วยงานอัตโนมัติที่สามารถปฏิบัติงานที่ซับซ้อนได้ ความเสี่ยงเชิงระบบรูปแบบใหม่กำลังปรากฏขึ้น Google DeepMind และพันธมิตรระดับโลกหลายรายได้เปิดตัวโครงการริเริ่มครั้งใหญ่เพื่อศึกษาพฤติกรรมที่ไม่อาจคาดเดาได้ ซึ่งเกิดขึ้นเมื่อเอเจนต์อัตโนมัติเหล่านี้หลายล้านตัวเริ่มมีปฏิสัมพันธ์กันในโลกแห่งความเป็นจริง
ปัญหาของระบบหลายเอเจนต์: ที่เหนือกว่าความปลอดภัยของโมเดลเดี่ยว
ในยุคปัจจุบันของ AI งานวิจัยส่วนใหญ่มักมุ่งเน้นไปที่ความปลอดภัยของโมเดลเดี่ยว เช่น การทำให้แน่ใจว่า LLM เฉพาะเจาะจงจะไม่แสดงเนื้อหาที่เป็นพิษหรือทำตามคำสั่งที่ประสงค์ร้าย อย่างไรก็ตาม Google DeepMind และพันธมิตรตระหนักดีว่าความท้าทายที่แท้จริงนั้นอยู่ที่ "ระบบหลายเอเจนต์" (multi-agent systems)
เมื่อมีการใช้งานเอเจนต์จำนวนมหาศาลทั่วทั้งระบบเศรษฐกิจ พวกมันจะสร้างระบบนิเวศที่ซับซ้อนซึ่งพฤติกรรมโดยรวมอาจแตกต่างจากผลรวมของส่วนประกอบแต่ละส่วนอย่างสิ้นเชิง "จิตรวมหมู่ของเอเจนต์" (agent hive mind) นี้อาจนำไปสู่ปัญญาอุบัติการณ์ (emergent intelligence) หรือที่น่ากังวลยิ่งกว่าคือความโกลาหลอุบัติการณ์ (emergent chaos) ผู้เชี่ยวชาญเตือนว่าเราไม่สามารถคาดการณ์ผลลัพธ์เหล่านี้ได้จากการศึกษาโมเดลที่แยกส่วนกัน แต่ผู้วิจัยต้องใช้การจำลองสถานการณ์ขนาดใหญ่ที่สมจริงเพื่อสังเกตว่าเอเจนต์มีปฏิสัมพันธ์ แข่งขัน หรือร่วมมือกันโดยไม่ได้ตั้งใจในสภาพแวดล้อมจำลองดิจิทัล (digital sandboxes) อย่างไร
พันธมิตรเงินทุน 10 ล้านดอลลาร์ เพื่อการวิจัยทางวิชาการ
เพื่อปิดช่องว่างนี้ Google DeepMind ได้รวบรวมพันธมิตรที่ทรงพลังเพื่อมอบเงินทุนจำนวน 10 ล้านดอลลาร์ให้แก่นักวิจัย ความร่วมมือนี้ประกอบด้วย Schmidt Sciences (มูลนิธิเพื่อการกุศลที่นำโดย Eric และ Wendy Schmidt), ARIA (หน่วยงานโครงการนวัตกรรมก้าวกระโดดของรัฐบาลสหราชอาณาจักร), มูลนิธิ Cooperative AI และ Google.org
เป้าหมายเชิงกลยุทธ์คือการย้ายงานวิจัยออกจากห้องปฏิบัติการของบริษัทเทคโนโลยียักษ์ใหญ่เข้าสู่ภาควิชาการ ในขณะที่ผู้นำในอุตสาหกรรมอย่าง Google และ Anthropic กำลังสร้างเทคโนโลยี แต่นักวิจัยทางวิชาการมีอิสระในการมองไปในอนาคตที่ไกลกว่า และตรวจสอบความเสี่ยงเชิงระบบในระยะยาวที่อาจไม่ใช่ลำดับความสำคัญเร่งด่วนสำหรับวงจรผลิตภัณฑ์เชิงพาณิชย์ เงินทุนนี้มีจุดมุ่งหมายเพื่อสร้างรากฐานของสาขา "ความปลอดภัยของระบบหลายเอเจนต์" (multi-agent safety) ซึ่งในปัจจุบันยังไม่มีอยู่จริง
จากการฉีดคำสั่ง (Prompt Injections) สู่ความโกลาหลในโลกดิจิทัล
ความเสี่ยงที่เกี่ยวข้องกับระบบหลายเอเจนต์ไม่ใช่แค่เรื่องทางทฤษฎี แต่มันคือเวอร์ชันที่ทวีความรุนแรงขึ้นของภัยคุกคามทางไซเบอร์ที่มีอยู่เดิม ความกังวลหลัก ได้แก่:
- การฉีดคำสั่งขั้นสูง (Advanced Prompt Injections): เอเจนต์อาจถูก "ควบคุม" (hijacked) ได้ด้วยประโยคที่เป็นอันตรายเพียงประโยคเดียวที่ซ่อนอยู่ในเอกสาร ซึ่งจะเปลี่ยนผู้ช่วยที่มีประโยชน์ให้กลายเป็นมัลแวร์ที่ทำงานด้วยตัวเอง
- การหลอกลวงและการโจมตีทางไซเบอร์แบบอัตโนมัติ: เอเจนต์ที่มีความสามารถในการใช้เหตุผลและปรับตัวตามสถานการณ์ สามารถดำเนินการวิศวกรรมสังคม (social engineering) หรือการแฮ็กที่มีความซับซ้อนและหลายขั้นตอนได้ในวงกว้าง
- ความไม่มั่นคงเชิงระบบ: เช่นเดียวกับที่สถาบันของมนุษย์สามารถก่อให้เกิดการเปลี่ยนแปลงทางเศรษฐกิจที่คาดไม่ถึง การใช้งานเอเจนต์อัตโนมัติจำนวนมหาศาลอาจนำไปสู่ "อนาธิปไตย" ทางดิจิทัล หรือความไม่มั่นคงของตลาด
ต่างจากซอฟต์แวร์แบบดั้งเดิมที่ดำเนินตามเส้นทางที่กำหนดไว้โดยมนุษย์ เอเจนต์ AI สามารถใช้เหตุผลและปรับตัวตามสถานการณ์ได้ ความไม่แน่นอนนี้ทำให้จำเป็นต้องเปลี่ยนไปสู่กรอบการทำงานแบบ "zero trust" ซึ่งเป็นแนวทางที่ Anthropic สนับสนุน โดยจะปฏิบัติกับเอเจนต์ทุกตัวเสมือนว่าเป็นช่องโหว่ที่อาจเกิดขึ้นได้
สรุปประเด็นสำคัญ
- โครงการริเริ่มด้านเงินทุนใหม่: Google DeepMind และพันธมิตรได้จัดสรรเงินจำนวน 10 ล้านดอลลาร์เพื่อสนับสนุนการวิจัยทางวิชาการเกี่ยวกับพฤติกรรมที่คาดเดาไม่ได้ของเอเจนต์ AI ที่มีการปฏิสัมพันธ์กัน
- ความเสี่ยงที่อุบัติขึ้น: ข้อกังวลหลักคือเอเจนต์อัตโนมัติหลายล้านตัวอาจสร้างความเสี่ยงเชิงระบบ เช่น การโจมตีทางไซเบอร์แบบอัตโนมัติ และพฤติกรรมแบบ "hive mind" (จิตรวมหมู่) ซึ่งไม่สามารถคาดการณ์ได้จากการทดสอบโมเดลเพียงตัวเดียว
- การเปลี่ยนผ่านกระบวนทัศน์ด้านความปลอดภัย: เมื่อเอเจนต์เปลี่ยนจากซอฟต์แวร์ที่ตายตัวไปสู่เอนทิตีที่มีความสามารถในการใช้เหตุผล อุตสาหกรรมจึงกำลังเปลี่ยนไปสู่โมเดล "zero trust" เพื่อลดความเสี่ยงจากการถูกควบคุมและการฉีดคำสั่ง (prompt injection)