Anthropic выпускает Claude Sonnet 5 для создания доступных ИИ-агентов

Anthropic официально представила Claude Sonnet 5 — модель среднего размера, разработанную специально для того, чтобы сократить разрыв между высокоуровневым рассуждением и экономически эффективным автономным выполнением задач. Делая ставку на «агентные» возможности — способность использовать инструменты, планировать и итерировать — Anthropic позиционирует Sonnet 5 как основное решение для разработчиков, создающих автоматизированные рабочие процессы.

Переход к агентному интеллекту

В текущей гонке вооружений в сфере ИИ индустрия переходит от простых чат-ботов к автономным агентам. Релиз Anthropic следует за аналогичными шагами OpenAI с GPT-5.6 Sol и Google с Gemini 3.5 Flash, что сигнализирует о том, что агентная производительность становится новым стандартом.

Claude Sonnet 5 спроектирована как автономный оператор, способный использовать браузеры и терминалы для выполнения многоэтапных задач. В отличие от предыдущих итераций, которые могли «зависать» на сложных последовательностях, Sonnet 5 демонстрирует уникальную способность «проверять собственные результаты» и завершать сквозные рабочие процессы. Например, инженеры Zapier отметили, что модель успешно выполнила двухэтапную задачу — обновление уровней аккаунтов в Salesforce и отправку объявлений о запуске для предприятий — процесс, на котором предыдущие модели заходили в тупик на полпути.

Тесты производительности: на уровне тяжеловесов

Хотя Sonnet 5 является моделью среднего размера, её показатели производительности приближаются к показателям флагмана Anthropic — Opus 4.8. В бенчмарках агентного программирования Sonnet 5 набрала 63,2%, что значительно выше, чем у её предшественницы Sonnet 4.6 (58,1%), и лишь немного уступает Opus 4.8 (69,2%).

Примечательно, что в специфических тестах на интеллектуальную работу Sonnet 5 фактически превзошла Opus 4.8. Это делает её высокоэффективным выбором для разработчиков, которым требуется глубокое рассуждение без переплаты за флагманскую модель. Anthropic предполагает, что в то время как Opus 4.8 остается стандартом для экстремальной точности и тонких суждений, Sonnet 5 предлагает идеальный баланс качества и стоимости для повседневной автоматизации.

Агрессивное ценообразование и стандарты безопасности

Чтобы стимулировать внедрение, Anthropic представила конкурентоспособную структуру ценообразования. До 31 августа стоимость Sonnet 5 составляет 2 доллара за миллион входных токенов и 10 долларов за миллион выходных токенов. По истечении этого периода цены изменятся на 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов. Такое позиционирование делает Sonnet 5 более доступной, чем GPT-5.5 от OpenAI и Gemini 3.1 Pro от Google, хотя она остается дороже, чем Gemini 3.5 Flash.

Безопасность так же критична при развертывании агентов, где первостепенное значение имеет способность модели отклонять вредоносные команды. Sonnet 5 демонстрирует снижение частоты «нежелательного поведения», такого как обман или содействие злоупотреблениям, по сравнению с Sonnet 4.6. Она также показала повышенную устойчивость к атакам типа prompt injection и более низкий уровень сикофантского поведения, что делает её более надежным партнером для разработчиков, внедряющих инструменты для миллионов пользователей.

Основные выводы

  • Агентная направленность: Sonnet 5 оптимизирована для автономных задач, включая использование инструментов (браузеры/терминалы) и самокоррекцию, что делает её идеальной для сложной автоматизации.
  • Экономическая эффективность: Модель предлагает высокопроизводительную и менее дорогую альтернативу флагманским моделям, таким как Opus 4.8, GPT-5.5 и Gemini 3.1 Pro.
  • Повышенная безопасность: Значительные улучшения в отклонении вредоносных запросов и сопротивлении prompt injection делают её более безопасной для агентных рабочих процессов.