Coinbase Beralih ke Model AI Tiongkok untuk Memangkas Biaya API

Saat lab AI Barat berjuang menyeimbangkan biaya komputasi yang masif dengan profitabilitas, para pemimpin industri mulai melirik ke Timur demi efisiensi. Coinbase telah resmi bergabung dengan kelompok raksasa teknologi yang kian berkembang yang beralih ke model AI Tiongkok untuk mengoptimalkan pengeluaran operasional mereka.

Peralihan ke Model Tiongkok: GLM dan Kimi

CEO Coinbase, Brian Armstrong, baru-baru ini mengungkapkan bahwa perusahaan telah mengintegrasikan model yang dikembangkan di Tiongkok, seperti GLM 5.2 dan Kimi 2.7, ke dalam infrastrukturnya. Peralihan strategis ini memungkinkan Coinbase untuk menangani volume token yang jauh lebih tinggi sekaligus memangkas pengeluaran AI-nya hingga setengahnya.

Langkah ini tidak hanya terbatas pada sektor kripto. Startup Lindy telah beralih ke DeepSeek v4, dan raksasa data Snowflake saat ini sedang menguji model-model Tiongkok sebagai alternatif hemat biaya dibandingkan penawaran mahal dari OpenAI dan Anthropic. Pergeseran ini menandakan transisi besar dalam cara perusahaan memandang "frontier" AI, dengan memprioritaskan rasio harga-terhadap-performa dibandingkan pengenalan merek.

Routing Cerdas dan Context Engineering

Untuk memaksimalkan penghematan ini, Coinbase telah menerapkan sistem routing otomatis. Alih-alih mengandalkan satu LLM tunggal, sistem ini mengevaluasi setiap permintaan berdasarkan tiga metrik kritis: kompleksitas tugas, biaya, dan potensi caching.

Eksekusi teknis dari strategi ini sangat bergantung pada "context engineering." Dengan mendorong pengembang untuk menjaga konteks tetap ramping dan memulai sesi baru untuk tugas-tugas baru, Coinbase berhasil meningkatkan tingkat caching hit dari hanya 5% menjadi 60%. Efisiensi ini memungkinkan perusahaan untuk memanfaatkan model yang lebih murah untuk tugas rutin sambil mencadangkan model dengan penalaran tinggi untuk operasi yang kompleks, sebuah teknik yang kini menjadi cetak biru untuk menskalakan alur kerja agentic.

Tokenmaxxing Bertemu dengan Akuntabilitas Performa

Kebangkitan model "agentic reasoning"—seperti seri GPT-5.x yang dinanti-nantikan—telah menyebabkan lonjakan konsumsi token. Sementara perusahaan seperti Amazon dan Meta melihat tren "tokenmaxxing," di mana karyawan menghabiskan token dalam jumlah masif tanpa pengawasan ketat, Coinbase menerapkan filosofi yang berbeda.

Armstrong telah memperkenalkan model visibilitas tanpa pembatasan: pengembang tidak dibatasi penggunaannya, tetapi pengeluaran mereka transparan. Prinsip panduannya adalah "akuntabilitas berbasis dampak"—semakin banyak pengembang menghabiskan token AI, semakin tinggi pula output dan dampak bisnis yang diharapkan. Pendekatan ini menyeimbangkan kebutuhan akan komputasi berat dengan kebutuhan akan ROI.

Uji Tekan Harga bagi Lab Barat

Eksodus menuju alternatif Tiongkok yang lebih murah memberikan tekanan besar pada lab AI Barat, terutama saat perusahaan seperti OpenAI dan Anthropic mengincar IPO dan perlu membuktikan pertumbuhan yang berkelanjutan. Perang harga yang mulai memanas sudah terlihat; OpenAI dilaporkan menanggapi persaingan dengan menawarkan varian yang lebih efisien token, seperti GPT-5.6-Sol, serta model yang lebih ringan dengan harga lebih rendah. Bagi penyedia Barat, tantangannya bukan lagi sekadar soal kecerdasan, melainkan tentang mempertahankan titik harga yang mencegah klien perusahaan bermigrasi ke kompetitor global yang lebih ekonomis.

Poin-Poin Penting

  • Optimasi Biaya: Coinbase telah memangkas pengeluaran AI-nya hingga setengahnya dengan mengintegrasikan model Tiongkok seperti GLM 5.2 dan Kimi 2.7 sambil meningkatkan total penggunaan token.
  • Efisiensi Teknis: Penerapan routing otomatis dan context engineering telah memungkinkan Coinbase untuk meningkatkan tingkat caching hit dari 5% menjadi 60%.
  • Tekanan Pasar: Peralihan ke model yang lebih murah memaksa lab Barat masuk ke dalam perang harga untuk membenarkan valuasi tinggi mereka dan prospek IPO mendatang.