CEO Snowflake: GLM-5.2 конкурує з Claude Opus 4.7 за значно меншу ціну

Нещодавній практичний бенчмарк, проведений Snowflake, викликав потрясіння в індустрії ШІ, показавши, що китайська модель GLM-5.2 здатна конкурувати з топовими західними моделями у спеціалізованих завданнях з програмування. Хоча Claude Opus 4.7 зберігає технічну перевагу, величезна різниця в ціні свідчить про майбутні зміни в економіці великих мовних моделей (LLM).

Бенчмарк: паритет у програмуванні в складних середовищах

CEO Snowflake Sridhar Ramaswamy очолив суворе тестування, що включало 103 окремі завдання, розроблені для оцінки генерації коду в середовищах DuckDB та Snowflake. Результати виявилися напрочуд близькими: за умови трьох спроб на кожне завдання, GLM-5.2 вирішила 66% завдань, лише трохи поступаючись Claude Opus 4.7, яка досягла 67% успішності.

Однак нюанси продуктивності виявляють розрив у надійності. Opus 4.7 продемонструвала вищу стабільність із точністю з першої спроби 53,7% порівняно з 47,6% у GLM-5.2. Китайська модель також виявила схильність до «надмірного мислення» або зациклення на непотрібних процесах. В одному помітному випадку GLM-5.2 виконала 411 викликів інструментів протягом 24 хвилин — перевіряючи кількість рядків, розподіли та значення null — проте зазнала невдачі в усіх трьох спробах. Натомість Opus 4.7 вирішила те саме завдання всього за 9 хвилин, зробивши лише 49 викликів.

Економіка ШІ: ціновий тиск з боку Китаю

Хоча Opus 4.7 є ефективнішою та стабільнішою моделлю, головна суть полягає в юніт-економіці. Різниця в вартості між західними флагманськими моделями та GLM-5.2 є приголомшливою і може докорінно змінити розрахунки ROI (окупності інвестицій) для впровадження ШІ на підприємствах.

Згідно з офіційними цінами Zhipu, GLM-5.2 коштує $1,40 за мільйон вхідних токенів і $4,40 за мільйон вихідних токенів. Для порівняння:

  • Claude Opus 4.7: $5,00 (Вхідні) / $25,00 (Вихідні)
  • GPT-5.5: $5,00 (Вхідні) / $30,00 (Вихідні)

Навіть попри те, що GLM-5.2 є більш «ненаситною до токенів» — у середньому виконуючи 99 запусків на завдання порівняно з 80 у Opus і споживаючи 860 мільйонів токенів проти 439 мільйонів у Opus — вона залишається значно доступнішою. Така модель ціноутворення становить пряму загрозу стратегіям високої маржинальності, які наразі використовують OpenAI та Anthropic.

Чому це важливо для ландшафту ШІ

Поява високопотужних і дешевих моделей, таких як GLM-5.2, слугує стрес-тестом для «бульбашки ШІ». Величезні оцінки західних лабораторій ШІ ґрунтуються на припущенні швидкого зростання доходів з високою маржинальністю. Якщо розробники та підприємства перейдуть на набагато дешевші альтернативи для часто виконуваних завдань, таких як програмування та інженерія даних, прогнозовані потоки доходів для флагманських моделей можуть зазнати значного скорочення.

Оскільки Snowflake готується надати доступ до GLM-5.2 своїм клієнтам, індустрія рухається до реальності, де «інтелект» більше не є предметом розкоші, а стає масовим товаром, доступним як загальна послуга.

Основні висновки

  • Конкурентний паритет: GLM-5.2 досягла 66% успішності в складних бенчмарках з програмування на Snowflake/DuckDB, майже зрівнявшись із 67% у Claude Opus 4.7.
  • Розрив в ефективності: Хоча GLM-5.2 є дуже потужною, вона менш ефективна, оскільки потребує більше викликів інструментів і вищого споживання токенів для пошуку рішень.
  • Економічна дестабілізація: GLM-5.2 пропонує ціну за вихідні токени приблизно в 1/5–1/7 вартість Claude Opus 4.7 або GPT-5.5, створюючи інтенсивний ціновий тиск на західних постачальників ШІ.