Coinbase переходит на китайские модели ИИ для сокращения расходов на API

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorial6 дней назад3мин чтения

Coinbase переходит на китайские модели ИИ для сокращения расходов на API

В этой статье

Coinbase переходит на китайские модели ИИ, чтобы сократить расходы на API

Пока западные лаборатории ИИ пытаются найти баланс между огромными затратами на вычисления и прибыльностью, лидеры отрасли начинают искать эффективность на Востоке. Coinbase официально присоединилась к растущей когорте технологических гигантов, переходящих на китайские модели ИИ для оптимизации своих операционных расходов.

Переход на китайские модели: GLM и Kimi

Генеральный директор Coinbase Брайан Амстронг недавно сообщил, что компания интегрировала в свою инфраструктуру разработанные в Китае модели, такие как GLM 5.2 и Kimi 2.7. Этот стратегический сдвиг позволил Coinbase обрабатывать значительно большие объемы токенов, одновременно сократив расходы на ИИ вдвое.

Этот шаг не ограничивается только криптосектором. Стартап Lindy перешел на DeepSeek v4, а гигант данных Snowflake в настоящее время тестирует китайские модели в качестве экономически эффективной альтернативы дорогостоящим предложениям от OpenAI и Anthropic. Этот сдвиг сигнализирует о масштабной трансформации в том, как предприятия воспринимают «передовой край» (frontier) ИИ, отдавая приоритет соотношению цены и производительности, а не узнаваемости бренда.

Интеллектуальная маршрутизация и контекстная инженерия

Чтобы максимизировать эту экономию, Coinbase внедрила систему автоматизированной маршрутизации. Вместо того чтобы полагаться на одну LLM, система оценивает каждый запрос на основе трех критических показателей: сложности задачи, стоимости и потенциала кэширования.

Техническая реализация этой стратегии во многом опирается на «контекстную инженерию» (context engineering). Поощряя разработчиков поддерживать лаконичный контекст и инициировать новые сессии для новых задач, Coinbase успешно увеличила показатель попадания в кэш (caching hit rate) с жалких 5% до 60%. Такая эффективность позволяет компании использовать более дешевые модели для рутинных задач, резервируя модели с высоким уровнем рассуждения (high-reasoning models) для сложных операций — этот метод становится шаблоном для масштабирования агентских рабочих процессов (agentic workflows).

Tokenmaxxing и подотчетность за производительность

Рост моделей «агентского рассуждения» (agentic reasoning) — таких как ожидаемая серия GPT-5.x — привел к резкому увеличению потребления токенов. В то время как в таких компаниях, как Amazon и Meta, наблюдается тенденция к «tokenmaxxing», когда сотрудники расходуют огромные объемы токенов без строгого контроля, Coinbase внедряет иную философию.

Амстронг представил модель прозрачности без ограничений: использование токенов разработчиками не лимитировано, но их расходы прозрачны. Руководящим принципом является «подотчетность на основе результата» (impact-based accountability): чем больше разработчик тратит на токены ИИ, тем выше должны быть ожидаемый результат и влияние на бизнес. Этот подход балансирует потребность в мощных вычислениях с необходимостью обеспечения окупаемости инвестиций (ROI).

Ценовой стресс-тест для западных лабораторий

Массовый переход на более дешевые китайские альтернативы оказывает огромное давление на западные лаборатории ИИ, особенно в то время, когда такие компании, как OpenAI и Anthropic, готовятся к IPO и должны доказать устойчивый рост. Назревающая ценовая война уже очевидна: по сообщениям, OpenAI противодействует конкуренции, предлагая более эффективные с точки зрения потребления токенов варианты, такие как GPT-5.6-Sol, а также более дешевые и облегченные модели. Для западных провайдеров задача теперь заключается не только в уровне интеллекта, но и в поддержании такой цены, которая не позволит корпоративным клиентам перейти к более экономичным глобальным конкурентам.

Основные выводы

Оптимизация затрат: Coinbase сократила расходы на ИИ вдвое, интегрировав китайские модели, такие как GLM 5.2 и Kimi 2.7, при этом увеличив общее использование токенов.
Техническая эффективность: Внедрение автоматизированной маршрутизации и контекстной инженерии позволило Coinbase повысить показатель попадания в кэш с 5% до 60%.
Рыночное давление: Переход на более дешевые модели вынуждает западные лаборатории вступать в ценовую войну, чтобы оправдать свои высокие оценки и перспективы предстоящих IPO.

Coinbase переходит на китайские модели ИИ для сокращения расходов на API

Coinbase переходит на китайские модели ИИ, чтобы сократить расходы на API

Переход на китайские модели: GLM и Kimi

Интеллектуальная маршрутизация и контекстная инженерия

Tokenmaxxing и подотчетность за производительность

Ценовой стресс-тест для западных лабораторий

Основные выводы

Продолжить чтение

Глава Snowflake: GLM 5.2 не уступает Claude Opus 4.7 при значительно меньших затратах

От токеномаксинга к ограничениям: кризис корпоративных затрат на ИИ

Прорыв Китая в области ИИ: новые инструменты кибербезопасности конкурируют с технологиями США