Coinbase เปลี่ยนมาใช้โมเดล AI ของจีนเพื่อลดต้นทุน API

ในขณะที่ห้องแล็บ AI ทางตะวันตกกำลังดิ้นรนเพื่อสร้างสมดุลระหว่างต้นทุนการประมวลผลมหาศาลกับความสามารถในการทำกำไร ผู้นำในอุตสาหกรรมเริ่มหันไปมองทางตะวันออกเพื่อหาประสิทธิภาพมากขึ้น Coinbase ได้เข้าร่วมกลุ่มยักษ์ใหญ่ด้านเทคโนโลยีที่กำลังเปลี่ยนทิศทางไปสู่โมเดล AI ของจีนอย่างเป็นทางการ เพื่อเพิ่มประสิทธิภาพในการบริหารจัดการค่าใช้จ่ายในการดำเนินงาน

การเปลี่ยนผ่านสู่โมเดลของจีน: GLM และ Kimi

Brian Armstrong ซีอีโอของ Coinbase เพิ่งเปิดเผยว่าบริษัทได้รวมโมเดลที่พัฒนาโดยจีน เช่น GLM 5.2 และ Kimi 2.7 เข้ากับโครงสร้างพื้นฐานของบริษัท การปรับเปลี่ยนเชิงกลยุทธ์นี้ช่วยให้ Coinbase สามารถรองรับปริมาณ token ได้มากขึ้นอย่างมีนัยสำคัญ ในขณะเดียวกันก็สามารถลดค่าใช้จ่ายด้าน AI ลงได้ถึงครึ่งหนึ่ง

ความเคลื่อนไหวนี้ไม่ได้จำกัดอยู่แค่ในภาคส่วนคริปโตเท่านั้น สตาร์ทอัพอย่าง Lindy ได้เปลี่ยนไปใช้ DeepSeek v4 และยักษ์ใหญ่ด้านข้อมูลอย่าง Snowflake กำลังทดสอบโมเดลของจีนเพื่อเป็นทางเลือกที่คุ้มค่ากว่าเมื่อเทียบกับบริการที่มีราคาสูงจาก OpenAI และ Anthropic การเปลี่ยนแปลงนี้ส่งสัญญาณถึงการเปลี่ยนผ่านครั้งใหญ่ในวิธีที่องค์กรต่างๆ มอง "พรมแดน" (frontier) ของ AI โดยให้ความสำคัญกับอัตราส่วนราคาต่อประสิทธิภาพ (price-to-performance ratio) มากกว่าความคุ้นเคยในแบรนด์

การจัดเส้นทางอัจฉริยะและการทำ Context Engineering

เพื่อเพิ่มผลประโยชน์จากการประหยัดต้นทุนเหล่านี้ให้สูงสุด Coinbase ได้นำระบบการจัดเส้นทางอัตโนมัติ (automated routing system) มาใช้ แทนที่จะพึ่งพา LLM เพียงตัวเดียว ระบบจะประเมินทุกคำขอโดยอิงจากเกณฑ์สำคัญ 3 ประการ ได้แก่ ความซับซ้อนของงาน, ต้นทุน และศักยภาพในการทำ caching

การดำเนินการทางเทคนิคของกลยุทธ์นี้พึ่งพา "context engineering" เป็นอย่างมาก โดยการสนับสนุนให้เหล่านักพัฒนาจัดการ context ให้กระชับและเริ่มเซสชันใหม่สำหรับงานใหม่ๆ ทำให้ Coinbase ประสบความสำเร็จในการเพิ่มอัตราการทำ caching hit rate จากเพียง 5% เป็น 60% ประสิทธิภาพนี้ช่วยให้บริษัทสามารถใช้โมเดลที่มีราคาถูกกว่าสำหรับงานประจำวัน ในขณะที่สำรองโมเดลที่มีความสามารถในการใช้เหตุผลสูง (high-reasoning models) ไว้สำหรับงานที่ซับซ้อน ซึ่งเป็นเทคนิคที่กำลังกลายเป็นต้นแบบสำหรับการขยายขอบเขตของ agentic workflows

เมื่อ Tokenmaxxing มาพบกับความรับผิดชอบด้านประสิทธิภาพ

การเติบโตของโมเดล "agentic reasoning" เช่น ซีรีส์ GPT-5.x ที่คาดการณ์กันไว้ ได้นำไปสู่การพุ่งสูงขึ้นของการใช้ token ในขณะที่บริษัทอย่าง Amazon และ Meta พบแนวโน้มของ "tokenmaxxing" ซึ่งพนักงานใช้ token จำนวนมหาศาลโดยไม่มีการควบคุมดูแลอย่างเข้มงวด แต่ Coinbase กำลังนำปรัชญาที่แตกต่างออกไปมาใช้

Armstrong ได้นำเสนอรูปแบบความโปร่งใสที่ไม่มีการจำกัด: นักพัฒนาจะไม่ถูกจำกัดเพดานการใช้งาน แต่การใช้จ่ายจะมีความโปร่งใส หลักการชี้นำคือ "ความรับผิดชอบตามผลกระทบ" (impact-based accountability) กล่าวคือ ยิ่งนักพัฒนาใช้ token AI มากเท่าไหร่ ผลลัพธ์ที่คาดหวังและผลกระทบทางธุรกิจก็ต้องสูงขึ้นตามไปด้วย แนวทางนี้ช่วยสร้างสมดุลระหว่างความต้องการการประมวลผลหนักๆ กับความจำเป็นในการสร้างผลตอบแทนจากการลงทุน (ROI)

บททดสอบความกดดันด้านราคาสำหรับห้องแล็บตะวันตก

การไหลออกไปยังทางเลือกของจีนที่มีราคาถูกกว่ากำลังสร้างแรงกดดันมหาศาลต่อห้องแล็บ AI ทางตะวันตก โดยเฉพาะอย่างยิ่งเมื่อบริษัทอย่าง OpenAI และ Anthropic กำลังเล็งเป้าหมายไปที่การทำ IPO และจำเป็นต้องพิสูจน์การเติบโตที่ยั่งยืน สงครามราคาที่กำลังก่อตัวขึ้นนั้นเห็นได้ชัดเจนแล้ว โดยมีรายงานว่า OpenAI กำลังตอบโต้การแข่งขันด้วยการเสนอโมเดลรุ่นที่ใช้ token ได้อย่างมีประสิทธิภาพมากขึ้น เช่น GPT-5.6-Sol และโมเดลที่มีน้ำหนักเบาและราคาถูกลง สำหรับผู้ให้บริการทางตะวันตก ความท้าทายไม่ใช่แค่เรื่องของความฉลาดอีกต่อไป แต่คือการรักษาจุดราคาที่ป้องกันไม่ให้ลูกค้าองค์กรย้ายไปหาคู่แข่งระดับโลกที่มีความคุ้มค่ามากกว่า

สรุปประเด็นสำคัญ

  • การเพิ่มประสิทธิภาพด้านต้นทุน: Coinbase สามารถลดค่าใช้จ่ายด้าน AI ลงได้ครึ่งหนึ่งด้วยการรวมโมเดลของจีนอย่าง GLM 5.2 และ Kimi 2.7 เข้ามา ในขณะที่สามารถเพิ่มปริมาณการใช้ token ทั้งหมดได้
  • ประสิทธิภาพทางเทคนิค: การนำระบบการจัดเส้นทางอัตโนมัติและ context engineering มาใช้ ช่วยให้ Coinbase สามารถเพิ่มอัตราการทำ caching hit rate จาก 5% เป็น 60%
  • แรงกดดันทางการตลาด: การเปลี่ยนผ่านไปสู่โมเดลที่มีราคาถูกกว่ากำลังบีบให้ห้องแล็บทางตะวันตกต้องเข้าสู่สงครามราคา เพื่อสร้างความสมเหตุสมผลให้กับมูลค่าบริษัทที่สูงและการคาดการณ์เรื่องการทำ IPO ที่กำลังจะมาถึง