Sam Altman กล่าวว่ากลุ่มผู้ที่สงสัยเรื่องการขยายขนาด (Scaling) เป็นตัวถ่วงการพัฒนา AI

Translated for your language. Read the original.

AI-assisted draft.

9 ชั่วโมงที่ผ่านมา3min read

In this article

Sam Altman เผย ผู้ที่สงสัยเรื่องการขยายขนาด (Scaling) คือผู้ที่ฉุดรั้งการพัฒนา AI

Sam Altman ซีอีโอของ OpenAI กำลังยืนยันอย่างหนักแน่นถึงพลังของการขยายขนาด (scaling) โดยโต้แย้งว่านักวิจัยในรุ่นก่อนหน้าได้ขัดขวางความก้าวหน้าด้วยการประเมินศักยภาพของ Large Language Models (LLMs) ต่ำเกินไป ในขณะที่การถกเถียงเรื่องขีดจำกัดของสถาปัตยกรรม transformer กำลังทวีความรุนแรงขึ้น Altman ยืนยันว่าหลักฐานเชิงประจักษ์บ่งชี้อย่างชัดเจนว่าการขยายขนาดของหน่วยประมวลผล (compute) และข้อมูลเป็นแนวทางที่ถูกต้อง

ราคาที่ต้องจ่ายให้กับความยึดมั่นทางความคิด (Intellectual Dogmatism)

ระหว่างการปรากฏตัวที่ Stanford เมื่อเร็วๆ นี้ Altman ได้กล่าวถึงความขัดแย้งระหว่างกลุ่มผู้สนับสนุนการขยายขนาดและกลุ่มผู้ที่สงสัย โดยมีการอ้างถึงผู้วิจารณ์อย่าง Yann LeCun จาก Meta ซึ่งเคยกล่าวไว้อย่างโด่งดังว่า LLMs คือ "ทางตัน" Altman เสนอว่าแรงต้านส่วนใหญ่ต่อสมมติฐานเรื่องการขยายขนาดนั้น เกิดจากการที่นักวิจัยมีความมั่นใจมากเกินไปในการคาดการณ์ว่า AI ไม่สามารถ ทำอะไรได้

เขาโต้แย้งว่าบุคคลสำคัญบางคนในอุตสาหกรรมได้ผูกโยงตัวตนทางวิชาชีพเข้ากับจุดยืนทางทฤษฎีเฉพาะด้าน ทำให้พวกเขาต่อต้านข้อมูลใหม่ๆ ที่ขัดแย้งกับความเชื่อเดิมที่ยึดถือมานาน แม้จะยอมรับว่า "world models" มีความสำคัญต่อความก้าวหน้าในสาขาอย่างหุ่นยนต์ แต่ Altman ยังคงยืนยันว่าเส้นทางปัจจุบันของ LLMs ไม่ใช่การเดินอ้อม แต่เป็นเครื่องยนต์หลักที่ขับเคลื่อนสติปัญญา

หลักฐานเชิงประจักษ์: ก้าวข้ามการจับคู่รูปแบบ (Pattern Matching)

หนึ่งในประเด็นสำคัญที่สุดในการปกป้องแนวคิดการขยายขนาดของ Altman คือการเปลี่ยนผ่านของ LLMs จากการเป็นเพียงเครื่องมือทำนายข้อความ ไปสู่เครื่องมือที่สามารถใช้เหตุผลเชิงสร้างสรรค์ได้ เขาได้อ้างถึงความสำเร็จครั้งสำคัญเมื่อเร็วๆ นี้ ที่โมเดลของ OpenAI สามารถพิสูจน์ข้อสันนิษฐานทางคณิตศาสตร์ (mathematical conjecture) ที่ผู้เชี่ยวชาญที่เป็นมนุษย์ไม่สามารถแก้ได้มาอย่างยาวนานให้เป็นเท็จได้สำเร็จ

พัฒนาการนี้มีความสำคัญอย่างยิ่งเพราะมันท้าทายวาทกรรมที่ว่า LLMs เป็นเพียง "นกแก้วสุ่ม" (stochastic parrots) ที่ไม่สามารถค้นพบสิ่งใหม่ๆ ได้จริง "ดังนั้น เห็นได้ชัดว่า LLMs มีความสามารถในการค้นหาความรู้ใหม่ๆ" Altman กล่าว พร้อมระบุว่าชุมชนคณิตศาสตร์กำลังเผชิญกับผลกระทบจากการพิสูจน์โดยใช้ AI อย่างจริงจัง การเปลี่ยนแปลงนี้บ่งชี้ว่าการขยายขนาดไม่ได้เพียงแค่ช่วยให้การสื่อสารลื่นไหลขึ้นเท่านั้น แต่ยังช่วยขยายขอบเขตของความสามารถทางสติปัญญาอีกด้วย

พรมแดนใหม่: การใช้เหตุผล เทียบกับ งานที่ต้องใช้ระยะเวลายาวนาน (Long-Horizon Tasks)

แม้จะมีความมองโลกในแง่ดี แต่ Altman ยังคงมองตามความเป็นจริงเกี่ยวกับข้อจำกัดในปัจจุบันของเทคโนโลยี เขาตั้งข้อสังเกตถึงช่องว่างของประสิทธิภาพที่ชัดเจนเมื่อพูดถึง "long-horizon tasks" หรือกระบวนการทำงานที่ซับซ้อนซึ่งต้องใช้การตัดสินใจระดับสูงอย่างต่อเนื่องและการวางแผนหลายขั้นตอนในช่วงระยะเวลาที่ยาวนาน ในโดเมนเฉพาะเหล่านี้ เขายอมรับว่า LLMs ยังคง "ดูแย่กว่ามนุษย์มาก"

สำหรับภาพรวมของวงการ AI ความแตกต่างนี้คือสิ่งที่กำหนดพรมแดนใหม่ของการวิจัย อุตสาหกรรมกำลังเปลี่ยนผ่านจากระยะ "การขยายขนาดเพื่อความรู้" (scaling for knowledge) ไปสู่ "การขยายขนาดเพื่อการใช้เหตุผลและการมีอำนาจตัดสินใจ" (scaling for reasoning and agency) ในขณะที่บริษัทอย่าง OpenAI และ Anthropic (นำโดยซีอีโอ Dario Amodei ผู้ที่มีความเชื่อมั่นในการขยายขนาดเช่นเดียวกับ Altman) ยังคงทุ่มเงินหลายพันล้านดอลลาร์ไปกับหน่วยประมวลผล เป้าหมายคือการเชื่อมช่องว่างระหว่างสติปัญญาชั่วขณะ กับความสามารถในการทำงานด้วยตนเองที่น่าเชื่อถือในระยะยาว

สรุปประเด็นสำคัญ

การขยายขนาดคือแรงขับเคลื่อนหลัก: Altman โต้แย้งว่าการประเมินผลกระทบของการเพิ่มหน่วยประมวลผลและข้อมูลต่ำเกินไป ได้ทำให้ความเร็วในการค้นพบสิ่งใหม่ๆ ของ AI ช้าลงในอดีต
การค้นพบเหนือกว่าการเลียนแบบ: ความสามารถของโมเดล OpenAI ในการแก้ข้อสันนิษฐานทางคณิตศาสตร์ที่ซับซ้อน พิสูจน์ให้เห็นว่า LLMs กำลังก้าวไปสู่การสร้างความรู้ที่แท้จริง
คอขวดถัดไป: แม้ว่าการขยายขนาดจะช่วยแก้ปัญหาได้มากมาย แต่ประสิทธิภาพในระดับมนุษย์สำหรับงานที่ต้องใช้ระยะเวลายาวนานและการตัดสินใจระดับสูง ยังคงเป็นอุปสรรคสำคัญถัดไปของอุตสาหกรรม

Sam Altman กล่าวว่ากลุ่มผู้ที่สงสัยเรื่องการขยายขนาด (Scaling) เป็นตัวถ่วงการพัฒนา AI

Sam Altman เผย ผู้ที่สงสัยเรื่องการขยายขนาด (Scaling) คือผู้ที่ฉุดรั้งการพัฒนา AI

ราคาที่ต้องจ่ายให้กับความยึดมั่นทางความคิด (Intellectual Dogmatism)

หลักฐานเชิงประจักษ์: ก้าวข้ามการจับคู่รูปแบบ (Pattern Matching)

พรมแดนใหม่: การใช้เหตุผล เทียบกับ งานที่ต้องใช้ระยะเวลายาวนาน (Long-Horizon Tasks)

สรุปประเด็นสำคัญ

Continue reading

การขยายขนาด AI สำหรับองค์กรโดยไม่ต้องเพิ่มจำนวนพนักงาน

Yann LeCun Warns of Impending Bubble for OpenAI and Anthropic

Subquadratic ประกาศความสำเร็จครั้งสำคัญในการแก้ปัญหาคอขวดแบบ Quadratic ของ LLM

การก้าวกระโดดด้านประสิทธิภาพและการผงาดขึ้นของอินเทอร์เฟซระหว่างสมองกับคอมพิวเตอร์

เกณฑ์มาตรฐาน AA Briefcase ใหม่เผยให้เห็นถึงความยากลำบากของ AI ในการทำงานด้านความรู้ที่แท้จริง