เจาะลึกเบื้องหลังคณิตศาสตร์: ชิป Jalapeño ของ OpenAI มุ่งเป้าไปที่เศรษฐศาสตร์ของ AI อย่างไร
OpenAI กำลังรุกหนักเพื่อแยกการเติบโตของตนออกจากต้นทุนฮาร์ดแวร์จากบุคคลที่สามที่พุ่งสูงขึ้น ด้วยการพัฒนาซิลิคอนที่ออกแบบมาโดยเฉพาะ ชิป "Jalapeño" รุ่นใหม่ ซึ่งเป็นวงจรรวมเฉพาะทาง (ASIC) ที่ออกแบบร่วมกับ Broadcom ถือเป็นการปรับเปลี่ยนเชิงกลยุทธ์ไปสู่การบูรณาการแนวดิ่ง (vertical integration) เพื่อเพิ่มประสิทธิภาพทางเศรษฐศาสตร์ของการทำ inference
การทำลายการพึ่งพา Nvidia
เป็นเวลาหลายปีที่อุตสาหกรรม AI ถูกกำหนดโดยวงจรการใช้จ่ายด้านทุน (capital expenditure) มหาศาลที่ครอบงำโดย Nvidia ด้วยการที่ Nvidia ครองอัตรากำไรโดยประมาณอยู่ที่ราว 75% ในปัจจุบัน ต้นทุนในการฝึกฝน (training) และการปรับใช้ (deploying) โมเดลขนาดใหญ่จึงกลายเป็นคอขวดสำคัญในการขยายขีดความสามารถของปัญญาประดิษฐ์ การพัฒนาชิป Jalapeño ของ OpenAI จึงเป็นการตอบสนองโดยตรงต่อแรงกดดันทางเศรษฐกิจนี้
ด้วยการเปลี่ยนจาก GPU อเนกประสงค์ไปสู่ ASIC ที่มีความเฉพาะทาง OpenAI ตั้งเป้าที่จะลด "ภาษี" ที่ต้องจ่ายให้กับผู้จำหน่ายฮาร์ดแวร์ลงอย่างมีนัยสำคัญ ชิป Jalapeño ถูกออกแบบสถาปัตยกรรมมาเพื่อจัดการกับภาระงานทางคณิตศาสตร์ที่มีอยู่ใน LLM inference โดยเฉพาะ ซึ่งแตกต่างจาก GPU ของ Nvidia ที่ออกแบบมาสำหรับงานประมวลผลแบบขนานที่หลากหลาย ความเชี่ยวชาญเฉพาะด้านนี้ช่วยให้มีประสิทธิภาพสูงขึ้น ใช้พลังงานน้อยลง และท้ายที่สุดคือทำให้ต้นทุนต่อโทเคน (cost per token) ต่ำลง
ความร่วมมือกับ Broadcom และข้อได้เปรียบของ ASIC
ความเป็นพันธมิตรกับ Broadcom เป็นองค์ประกอบสำคัญของกลยุทธ์นี้ Broadcom เป็นผู้เชี่ยวชาญในแวดวงเซมิคอนดักเตอร์ ซึ่งให้ความเชี่ยวชาญทางเทคนิคที่จำเป็นในการเปลี่ยนจากงานออกแบบสถาปัตยกรรมไปสู่ซิลิคอนจริง การใช้แนวทางแบบ ASIC ช่วยให้ OpenAI สามารถฝังการดำเนินการทางคณิตศาสตร์เฉพาะที่โมเดลต้องการ—เช่น การคูณเมทริกซ์ (matrix multiplication) และกลไกความสนใจ (attention mechanisms)—ลงในวงจรฮาร์ดแวร์ได้โดยตรง
การเพิ่มประสิทธิภาพในระดับนี้ทำได้ยากด้วยฮาร์ดแวร์อเนกประสงค์ ASIC สามารถตัดส่วนเกินของฟีเจอร์ที่ไม่ได้ใช้งานออกไป และจัดสรรพื้นที่บนได (die area) ให้กับหน่วยประมวลผล (compute units) ที่สำคัญที่สุดสำหรับสถาปัตยกรรมแบบ transformer สำหรับนักพัฒนาและผู้ก่อตั้ง การเปลี่ยนแปลงนี้บ่งชี้ถึงอนาคตที่การปรับใช้โมเดลจะมีความยั่งยืนทางเศรษฐกิจมากขึ้น ซึ่งอาจช่วยให้โมเดลการใช้เหตุผล (reasoning models) ที่ซับซ้อนยิ่งขึ้นสามารถทำงานได้ด้วยต้นทุนเพียงเศษเสี้ยวของปัจจุบัน
นัยสำคัญต่อภูมิทัศน์โครงสร้างพื้นฐาน AI
การปรากฏขึ้นของชิป Jalapeño ส่งสัญญาณถึงการเปลี่ยนแปลงที่กว้างขึ้นในอุตสาหกรรม AI นั่นคือยุคของ "Model-Hardware Co-design" เมื่อโมเดลระดับแนวหน้า (frontier models) มีความเฉพาะทางมากขึ้น ช่องว่างระหว่างสิ่งที่ฮาร์ดแวร์อเนกประสงค์ทำได้ กับสิ่งที่ซิลิคอนที่ได้รับการปรับแต่งแล้วสามารถทำได้ก็จะยิ่งกว้างขึ้น
หาก OpenAI สามารถขยายขนาดการผลิตซิลิคอนที่ออกแบบเองนี้ได้สำเร็จ มันจะสร้างปราการ (moat) ที่แข็งแกร่ง ไม่เพียงแต่จะช่วยลดต้นทุนโดยตรงในการขยายขนาดเท่านั้น แต่ยังเป็นการสร้าง stack ฮาร์ดแวร์และซอฟต์แวร์ที่เป็นกรรมสิทธิ์ ซึ่งคู่แข่งที่พึ่งพาเพียงชิปสำเร็จรูป (off-the-shelf chips) อาจยากที่จะเทียบเคียงได้ในแง่ของประสิทธิภาพต่อราคา (price-performance) การเคลื่อนไหวนี้บีบให้ต้องมีการประเมินห่วงโซ่คุณค่า (value chain) ของ AI ใหม่ทั้งหมด โดยผลักดันอุตสาหกรรมไปสู่โมเดลที่ห้องปฏิบัติการ AI ที่ประสบความสำเร็จที่สุดจะเป็นผู้ออกแบบฮาร์ดแวร์ที่มีประสิทธิภาพที่สุดด้วยเช่นกัน
สรุปประเด็นสำคัญ
- การลดต้นทุน: ชิป Jalapeño เป็นการเคลื่อนไหวเชิงกลยุทธ์เพื่อลดการใช้จ่ายด้านทุนมหาศาล และหลีกเลี่ยงอัตรากำไรที่สูงของผู้ให้บริการฮาร์ดแวร์อย่าง Nvidia
- สถาปัตยกรรมเฉพาะทาง: ASIC นี้ได้รับการพัฒนาขึ้นร่วมกับ Broadcom โดยได้รับการปรับแต่งให้เหมาะสมกับความต้องการทางคณิตศาสตร์สำหรับการทำ LLM inference โดยเฉพาะ แทนที่จะเป็นการประมวลผลแบบอเนกประสงค์
- การบูรณาการแนวดิ่ง: OpenAI กำลังเปลี่ยนไปสู่โมเดลการออกแบบร่วมกัน (co-design model) ซึ่งซิลิคอนที่ออกแบบเองและซอฟต์แวร์ขั้นสูงจะทำงานร่วมกันเพื่อลดต้นทุนต่อโทเคนและรองรับการขยายขนาดในระดับมหาศาล
