ทำลายระบบความคิดแบบฝูงชนของ AI: วิธีที่ Flint กำลังต่อสู้กับภาวะ Groupthink ใน LLM
แม้ว่าโมเดลภาษาขนาดใหญ่ (LLM) อย่าง ChatGPT และ Claude จะมีความเชี่ยวชาญในการเขียนโค้ดและการวิจัย แต่พวกมันกำลังตกหลุมพรางของภาวะ "groupthink" (ความคิดแบบกลุ่ม) ที่คาดเดาได้มากขึ้นเรื่อยๆ ในขณะที่โมเดลกระแสหลักเริ่มให้คำตอบที่ซ้ำซากและมีความน่าจะเป็นสูงเหมือนๆ กัน สตาร์ทอัพรายใหม่กำลังพยายามเติมเต็มความหลากหลายที่จำเป็นอย่างยิ่งเข้าไปในระบบนิเวศของ Generative AI
ปัญหา: ผลกระทบของ "Artificial Hivemind"
ข้อจำกัดที่สำคัญในการพัฒนา LLM ในปัจจุบันคือแนวโน้มที่โมเดลจะมุ่งไปสู่คำตอบที่มีความน่าจะเป็นทางสถิติสูงสุด ซึ่งนำไปสู่ปรากฏการณ์ที่นักวิจัยเรียกว่า "Artificial Hivemind" งานวิจัยที่ได้รับรางวัลจาก NeurIPS เรื่อง “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)” ได้เปิดโปงการทำซ้ำที่ฝังรากลึกนี้
ทีมวิจัยได้ทดสอบ LLM ที่แตกต่างกัน 25 โมเดล ซึ่งรวมถึงโมเดลหลักจากสหรัฐอเมริกาและเวอร์ชันโอเพนซอร์สจากจีน เมื่อถูกขอให้ยกคำอุปมาสำหรับ "เวลา" คำตอบส่วนใหญ่จากทั้งหมด 1,250 คำตอบ กลับมุ่งไปสู่คำกล่าวที่ซ้ำซากจำเจ เช่น "เวลาคือสายน้ำ" หรือ "เวลาคือช่างทอผ้า" การขาดความหลากหลายนี้ไม่ใช่แค่เรื่องบังเอิญ แต่เป็นผลพลอยได้จากการฝึกฝนโมเดลด้วยชุดข้อมูลที่คล้ายคลึงกัน โดยมีเป้าหมายหลักเพื่อเพิ่มความน่าเชื่อถือและความสอดคล้องให้ได้มากที่สุด OpenAI ได้ยอมรับว่าการพยายามสร้างความแปลกใหม่อาจนำไปสู่คำตอบที่อ่อนแอลงและน่าเชื่อถือน้อยลงในบางครั้ง นั่นคือเหตุผลที่โมเดลส่วนใหญ่เลือกใช้คำตอบที่ "มีความน่าจะเป็นสูง" และปลอดภัยเป็นค่าเริ่มต้น
การมาถึงของ Flint: ให้ความสำคัญกับความหลากหลายมากกว่าความคาดเดาได้
Springboards สตาร์ทอัพจากออสเตรเลียกำลังท้าทายสถานะที่เป็นอยู่ด้วยโมเดลใหม่ของพวกเขา นั่นคือ Flint ซึ่งแตกต่างจากโมเดลกระแสหลักที่พยายามต่อสู้กับอาการหลอน (hallucinations) ในทุกวิถีทาง Pip Bingemann ซีอีโอของ Springboards แย้งว่าความแตกต่างที่คาดเดาไม่ได้ในระดับหนึ่งนั้นเป็นสิ่งจำเป็นสำหรับงานสร้างสรรค์
ในการทดสอบเชิงปฏิบัติ ความแตกต่างในการกระจายตัวของผลลัพธ์นั้นชัดเจนมาก:
- ความสุ่ม (Randomness): เมื่อถูกขอตัวเลขสุ่ม ChatGPT และ Claude มักจะให้คำตอบเป็น "7" ในขณะที่ Flint ให้ตัวเลขที่มีความแม่นยำสูงและไม่ใช่ตัวเลขมาตรฐาน เช่น "3.7916"
- การสร้างแบรนด์เชิงสร้างสรรค์ (Creative Branding): เมื่อถูกสั่งให้คิดสโลแกนสำหรับ New Balance ทั้ง Claude และ ChatGPT ต่างก็ให้คำว่า "Run your way" ในขณะที่ Flint นำเสนอทางเลือกที่แตกต่างออกไปคือ: "Built to last, run to win"
- การเลือกคำนาม (Noun Selection): ในขณะที่โมเดลกระแสหลักมักจะเอนเอียงไปทางแบรนด์ที่ "ปลอดภัย" อย่าง Toyota หรือ Honda แต่ Flint แสดงให้เห็นถึงขอบเขตที่กว้างกว่า โดยเลือกตัวเลือกที่คาดเดาได้ยากกว่า เช่น Ford F-150
เครื่องมือสร้างสรรค์สำหรับมืออาชีพ
Springboards ไม่ได้เพียงแค่สร้างโมเดลแบบเอกเทศเท่านั้น แต่พวกเขากำลังพัฒนาเครื่องมือเฉพาะทางสำหรับมืออาชีพด้านการโฆษณาและการตลาด แพลตฟอร์มนี้ช่วยให้ผู้ใช้สามารถรวบรวมผลลัพธ์จากหลายโมเดล รวมถึง ChatGPT และ Claude แล้วนำมาผสมผสานเพื่อสังเคราะห์ไอเดียใหม่ๆ Flint ทำหน้าที่เป็น "เครื่องดีดสร้างสรรค์" (creative catapult) ภายในระบบนิเวศนี้ ซึ่งได้รับการออกแบบมาโดยเฉพาะเพื่อผลักดันให้ผู้ใช้ออกจากกรอบความคิดเดิมๆ
Zoe Scaman ประธานเจ้าหน้าที่ฝ่ายกลยุทธ์ที่ 77X ตั้งข้อสังเกตว่า ในขณะที่โมเดลกระแสหลักมักจะเสนอวิธีแก้ปัญหาเดิมๆ ที่น่าเบื่อ (เช่น "การสอนความรู้ทางการเงินในรูปแบบที่สนุกสนาน") แต่ Flint กลับให้มุมมองที่เปลี่ยนไปอย่างสิ้นเชิง เช่น การเสนอให้มีการสร้างแบรนด์ใหม่ทั้งหมดสำหรับแนวคิดเรื่องการสะสมความมั่งคั่งเอง
สรุปประเด็นสำคัญ
- ความเหมือนกันของ LLM (LLM Homogeneity): โมเดลหลักๆ กำลังมุ่งไปสู่คำตอบที่คล้ายคลึงและคาดเดาได้เนื่องจากใช้วิธีการฝึกฝนที่คล้ายกัน ทำให้เกิดปรากฏการณ์ "Artificial Hivemind"
- แนวทางของ Flint: โมเดล Flint ของ Springboards ให้ความสำคัญกับความหลากหลายและความแตกต่างของคำตอบ ทำให้เหมาะสำหรับการระดมสมองและกลยุทธ์เชิงสร้างสรรค์มากกว่าโมเดลมาตรฐานทั่วไป
- การแลกเปลี่ยนระหว่างความน่าเชื่อถือ (The Reliability Trade-off): อุตสาหกรรมกำลังเผชิญกับความตึงเครียดพื้นฐานระหว่างความน่าเชื่อถือของโมเดล (การรักษาคำตอบให้อยู่ในขอบเขตที่มีความน่าจะเป็นสูง) และความแปลกใหม่เชิงสร้างสรรค์ (การยอมรับผลลัพธ์ที่หลากหลายและมีความน่าจะเป็นต่ำกว่า)
