Anthropic запускає Claude Sonnet 5 для забезпечення роботи доступних ШІ-агентів
Anthropic офіційно випустила Claude Sonnet 5 — модель середнього розміру, розроблену спеціально для того, щоб подолати розрив між високорівневим міркуванням та економічно ефективним автономним виконанням завдань. Надаючи пріоритет «агентським» можливостям — здатності використовувати інструменти, планувати та ітерувати — Anthropic позиціонує Sonnet 5 як основний рушій для розробників, які створюють автоматизовані робочі процеси.
Зсув у бік агентського інтелекту
У сучасній гонці озброєнь у сфері ШІ індустрія переходить від простих чат-ботів до автономних агентів. Реліз Anthropic повторює подібні кроки OpenAI з GPT-5.6 Sol та Google з Gemini 3.5 Flash, що сигналізує про те, що агентська продуктивність стає новим стандартом.
Claude Sonnet 5 розроблена, щоб діяти як автономний оператор, здатний використовувати браузери та термінали для виконання багатоетапних завдань. На відміну від попередніх ітерацій, які могли зупинятися під час складних послідовностей, Sonnet 5 демонструє унікальну здатність «перевіряти власні результати» та завершувати робочі процеси від початку до кінця. Наприклад, інженери Zapier зазначили, що модель успішно виконала двокомпонентне завдання — оновлення рівнів акаунтів Salesforce та розсилку оголошень про запуск для підприємств — процес, через який попередні моделі раніше зупинялися на півдорозі.
Тести продуктивності: на рівні з важковаговиками
Хоча Sonnet 5 є моделлю середнього розміру, її показники продуктивності наближаються до показників флагмана Anthropic — Opus 4.8. У тестах на агентське програмування Sonnet 5 набрала 63,2%, що значно вище за її попередника Sonnet 4.6 (58,1%), і лише трохи поступається Opus 4.8 (69,2%).
Примітно, що в специфічних тестах на інтелектуальну роботу Sonnet 5 фактично перевершила Opus 4.8. Це робить її високоефективним вибором для розробників, яким потрібне глибоке міркування без високої вартості топової моделі. Anthropic припускає, що хоча Opus 4.8 залишається стандартом для надвисокої точності та тонких суджень, Sonnet 5 пропонує ідеальний баланс якості та вартості для щоденної автоматизації.
Агресивне ціноутворення та стандарти безпеки
Щоб стимулювати впровадження, Anthropic запровадила конкурентну структуру ціноутворення. До 31 серпня ціна Sonnet 5 становить 2 долари за мільйон вхідних токенів і 10 доларів за мільйон вихідних токенів. Після цього періоду ціни зміняться на 3 долари за мільйон вхідних токенів і 15 доларів за мільйон вихідних токенів. Таке позиціонування робить Sonnet 5 доступнішою за GPT-5.5 від OpenAI та Gemini 3.1 Pro від Google, хоча вона залишається дорожчою за Gemini 3.5 Flash.
Безпека є не менш критичною при розгортанні агентів, де здатність моделі відхиляти шкідливі команди має першочергове значення. Sonnet 5 демонструє знижений рівень «небажаної поведінки», такої як обман або сприяння зловживанням, порівняно з Sonnet 4.6. Вона також продемонструвала підвищену стійкість до атак типу prompt injection та нижчий рівень підлесливої поведінки (sycophantic behavior), що робить її надійнішим партнером для розробників, які впроваджують інструменти для мільйонів користувачів.
Основні висновки
- Агентський фокус: Sonnet 5 оптимізована для автономних завдань, включаючи використання інструментів (браузерів/терміналів) та самокорекцію, що робить її ідеальною для складної автоматизації.
- Економічна ефективність: Модель пропонує високопродуктивну та дешевшу альтернативу флагманським моделям, таким як Opus 4.8, GPT-5.5 та Gemini 3.1 Pro.
- Покращена безпека: Значні покращення у відмові на шкідливі запити та стійкості до prompt injection роблять її безпечнішою для агентських робочих процесів.
