CEO Snowflake: GLM-5.2 конкурирует с Claude Opus 4.7 при значительно меньшей стоимости

Недавний практический бенчмарк, проведенный компанией Snowflake, вызвал потрясение в индустрии ИИ, показав, что китайская модель GLM-5.2 способна конкурировать с ведущими западными моделями в специализированных задачах программирования. Хотя Claude Opus 4.7 сохраняет техническое преимущество, огромная разница в цене указывает на грядущий сдвиг в экономике больших языковых моделей (LLM).

Бенчмарк: паритет в программировании в сложных средах

Генеральный директор Snowflake Шридхар Рамасвами провел тщательное тестирование, включавшее 103 различные задачи, предназначенные для оценки генерации кода как в среде DuckDB, так и в Snowflake. Результаты оказались на удивление близкими: при предоставлении трех попыток на задачу GLM-5.2 справилась с 66% задач, лишь незначительно уступая Claude Opus 4.7, чей показатель успеха составил 67%.

Однако нюансы производительности выявляют разрыв в надежности. Opus 4.7 продемонстрировала превосходную стабильность: точность с первой попытки составила 53,7% против 47,6% у GLM-5.2. Китайская модель также проявила склонность к «избыточному мышлению» или зацикливанию на ненужных процессах. В одном примечательном случае GLM-5.2 выполнила 411 вызовов инструментов в течение 24 минут — проверяя количество строк, распределения и значения null — но провалила все три попытки. Напротив, Opus 4.7 решила ту же задачу всего за 9 минут, совершив лишь 49 вызовов.

Экономика ИИ: ценовое давление со стороны Китая

Хотя Opus 4.7 является более эффективной и стабильной моделью, основная суть заключается в юнит-экономике. Разница в стоимости между флагманскими западными моделями и GLM-5.2 ошеломляет и может коренным образом изменить расчеты ROI для внедрения ИИ на предприятиях.

Согласно официальным ценам Zhipu, GLM-5.2 стоит $1,40 за миллион входных токенов и $4,40 за миллион выходных токенов. Для сравнения:

  • Claude Opus 4.7: $5,00 (входные) / $25,00 (выходные)
  • GPT-5.5: $5,00 (входные) / $30,00 (выходные)

Несмотря на то, что GLM-5.2 более «прожорлива» в плане токенов — в среднем 99 запусков на задачу по сравнению с 80 у Opus, и потребляет 860 миллионов токенов против 439 миллионов у Opus — она остается значительно более доступной. Такая модель ценообразования бросает прямой вызов стратегиям высокой маржинальности, которые в настоящее время используют OpenAI и Anthropic.

Почему это важно для ландшафта ИИ

Появление высокопроизводительных и недорогих моделей, таких как GLM-5.2, служит стресс-тестом для «пузыря ИИ». Огромные оценки западных ИИ-лабораторий основаны на предположении о быстром и высокомаржинальном росте выручки. Если разработчики и предприятия переключатся на гораздо более дешевые альтернативы для высокочастотных задач, таких как программирование и инженерия данных, прогнозируемые потоки доходов для флагманских моделей могут значительно сократиться.

Поскольку Snowflake готовится предоставить доступ к GLM-5.2 своим клиентам, индустрия движется к реальности, в которой «интеллект» перестает быть предметом роскоши и становится массовым общедоступным ресурсом.

Основные выводы

  • Паритет конкуренции: GLM-5.2 достигла 66% успеха в сложных бенчмарках по программированию в Snowflake/DuckDB, почти сравнявшись с показателем Claude Opus 4.7 (67%).
  • Разрыв в эффективности: Несмотря на высокую функциональность, GLM-5.2 менее эффективна, требуя больше вызовов инструментов и большего потребления токенов для поиска решений.
  • Экономический прорыв: GLM-5.2 предлагает цену за выходные токены примерно в 5–7 раз ниже, чем у Claude Opus 4.7 или GPT-5.5, создавая мощное ценовое давление на западных поставщиков ИИ.