Coinbase Beralih ke Model AI China untuk Mengurangkan Kos API

Ketika makmal AI Barat bergelut untuk mengimbangi kos pengkomputeran yang besar dengan keuntungan, peneraju industri mula beralih ke Timur untuk mencari kecekapan. Coinbase telah secara rasmi menyertai kumpulan gergasi teknologi yang semakin berkembang yang beralih ke arah model AI China untuk mengoptimumkan perbelanjaan operasi mereka.

Peralihan ke Model China: GLM dan Kimi

CEO Coinbase, Brian Armstrong, baru-baru ini mendedahkan bahawa syarikat tersebut telah menyepadukan model yang dibangunkan di China, seperti GLM 5.2 dan Kimi 2.7, ke dalam infrastrukturnya. Peralihan strategik ini telah membolehkan Coinbase mengendalikan volum token yang jauh lebih tinggi sambil mengurangkan perbelanjaan AI sebanyak separuh.

Langkah ini tidak terhad kepada sektor kripto sahaja. Syarikat pemula Lindy telah beralih kepada DeepSeek v4, dan gergasi data Snowflake kini sedang menguji model-model China sebagai alternatif kos efektif kepada tawaran harga tinggi daripada OpenAI dan Anthropic. Peralihan ini menandakan transisi besar dalam cara perusahaan melihat "sempadan" (frontier) AI, dengan mengutamakan nisbah harga-kepada-prestasi berbanding keakraban jenama.

Penghalaan Pintar dan Kejuruteraan Konteks

Untuk memaksimumkan penjimatan ini, Coinbase telah melaksanakan sistem penghalaan automatik. Daripada bergantung kepada satu LLM sahaja, sistem ini menilai setiap permintaan berdasarkan tiga metrik kritikal: kerumitan tugas, kos, dan potensi pengepalaan (caching).

Pelaksanaan teknikal strategi ini sangat bergantung kepada "kejuruteraan konteks" (context engineering). Dengan menggalakkan pembangun untuk mengekalkan konteks yang ringkas dan memulakan sesi baharu untuk tugas baharu, Coinbase berjaya meningkatkan kadar hit pengepalaan (caching hit rate) daripada hanya 5% kepada 60%. Kecekapan ini membolehkan syarikat memanfaatkan model yang lebih murah untuk tugas rutin sambil menyimpan model penaakulan tinggi untuk operasi yang kompleks, satu teknik yang kini menjadi pelan tindakan untuk menskalakan aliran kerja ejen (agentic workflows).

Tokenmaxxing Bertemu Akauntabiliti Prestasi

Kebangkitan model "penaakulan ejen" (agentic reasoning)—seperti siri GPT-5.x yang dijangkakan—telah menyebabkan lonjakan dalam penggunaan token. Walaupun syarikat seperti Amazon dan Meta telah melihat trend "tokenmaxxing", di mana pekerja menggunakan jumlah token yang sangat besar tanpa pengawasan ketat, Coinbase melaksanakan falsafah yang berbeza.

Armstrong telah memperkenalkan model keterlihatan tanpa sekatan: pembangun tidak dihadkan penggunaannya, tetapi perbelanjaan mereka adalah telus. Prinsip panduannya ialah "akauntabiliti berasaskan impak"—semakin banyak pembangun membelanjakan token AI, semakin tinggi output dan impak perniagaan yang diharapkan. Pendekatan ini mengimbangi keperluan pengkomputeran berat dengan keperluan ROI.

Ujian Tekanan Harga untuk Makmal Barat

Penghijrahan ke arah alternatif China yang lebih murah meletakkan tekanan yang amat besar kepada makmal AI Barat, terutamanya apabila syarikat seperti OpenAI dan Anthropic menyasarkan IPO dan perlu membuktikan pertumbuhan yang mampan. Perang harga yang sedang meletus sudah pun jelas kelihatan; OpenAI dilaporkan melawan persaingan dengan menawarkan varian yang lebih cekap token, seperti GPT-5.6-Sol, dan model yang lebih ringan dengan harga lebih rendah. Bagi penyedia Barat, cabarannya bukan lagi sekadar tentang kecerdasan, tetapi tentang mengekalkan titik harga yang menghalang pelanggan perusahaan daripada beralih kepada pesaing global yang lebih ekonomik.

Ringkasan Utama

  • Pengoptimuman Kos: Coinbase telah mengurangkan perbelanjaan AI sebanyak separuh dengan menyepadukan model China seperti GLM 5.2 dan Kimi 2.7 sambil meningkatkan jumlah penggunaan token.
  • Kecekapan Teknikal: Pelaksanaan penghalaan automatik dan kejuruteraan konteks telah membolehkan Coinbase meningkatkan kadar hit pengepalaan daripada 5% kepada 60%.
  • Tekanan Pasaran: Peralihan ke arah model yang lebih murah memaksa maklab Barat ke dalam perang harga untuk mewajarkan penilaian tinggi mereka dan prospek IPO yang akan datang.