Anthropic lanza Claude Sonnet 5 para potenciar agentes de IA asequibles

Anthropic ha lanzado oficialmente Claude Sonnet 5, un modelo de tamaño medio diseñado específicamente para cerrar la brecha entre el razonamiento de alto nivel y la ejecución autónoma rentable. Al priorizar las capacidades "agénticas" —la capacidad de usar herramientas, planificar e iterar—, Anthropic está posicionando a Sonnet 5 como el motor de referencia para los desarrolladores que construyen flujos de trabajo automatizados.

El cambio hacia la inteligencia agéntica

En la actual carrera armamentista de la IA, la industria está pasando de los simples chatbots a los agentes autónomos. El lanzamiento de Anthropic sigue movimientos similares de OpenAI con GPT-5.6 Sol y de Google con Gemini 3.5 Flash, lo que indica que el rendimiento agéntico es el nuevo estándar.

Claude Sonnet 5 está diseñado para actuar como un operador autónomo, capaz de utilizar navegadores y terminales para ejecutar tareas de múltiples pasos. A diferencia de iteraciones anteriores que podrían estancarse durante secuencias complejas, Sonnet 5 demuestra una capacidad única para "verificar su propio resultado" y completar flujos de trabajo de extremo a extremo. Por ejemplo, los ingenieros de Zapier señalaron que el modelo completó con éxito una tarea de dos partes —actualizar los niveles de cuenta de Salesforce y enviar anuncios de lanzamiento empresarial—, un proceso que anteriormente causaba que los modelos anteriores fallaran a mitad de camino.

Benchmarks de rendimiento: a la altura de los pesos pesados

Aunque Sonnet 5 es un modelo de tamaño medio, sus métricas de rendimiento se acercan a las de la joya de la corona de Anthropic, Opus 4.8. En los benchmarks de codificación agéntica, Sonnet 5 obtuvo una puntuación del 63,2%, significativamente mayor que la de su predecesor Sonnet 4.6 (58,1%), y quedando solo ligeramente por detrás de Opus 4.8 (69,2%).

Sorprendentemente, en benchmarks específicos de trabajo de conocimiento, Sonnet 5 superó de hecho a Opus 4.8. Esto lo convierte en una opción altamente eficiente para los desarrolladores que necesitan un razonamiento profundo sin el precio premium de un modelo de primer nivel. Anthropic sugiere que, si bien Opus 4.8 sigue siendo el estándar para una precisión extrema y un juicio sutil, Sonnet 5 ofrece el equilibrio ideal entre calidad y coste para la automatización diaria.

Precios agresivos y estándares de seguridad

Para impulsar la adopción, Anthropic ha introducido una estructura de precios competitiva. Hasta el 31 de agosto, Sonnet 5 tiene un precio de $2 por millón de tokens de entrada y $10 por millón de tokens de salida. Tras este periodo, los precios se ajustarán a $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Este posicionamiento hace que Sonnet 5 sea más asequible que GPT-5.5 de OpenAI y Gemini 3.1 Pro de Google, aunque sigue siendo más caro que Gemini 3.5 Flash.

La seguridad es igualmente crítica en los despliegues agénticos, donde la capacidad de un modelo para rechazar comandos maliciosos es primordial. Sonnet 5 muestra una tasa reducida de "comportamientos indeseables", como el engaño o la cooperación con el uso indebido, en comparación con Sonnet 4.6. También ha demostrado una mayor resiliencia contra los ataques de inyección de prompts y una menor tasa de comportamiento sicofante, lo que lo convierte en un socio más fiable para los desarrolladores que despliegan herramientas para millones de usuarios.

Conclusiones clave

  • Enfoque agéntico: Sonnet 5 está optimizado para tareas autónomas, incluyendo el uso de herramientas (navegadores/terminales) y la autocorrección, lo que lo hace ideal para la automatización compleja.
  • Eficiencia de costes: El modelo ofrece una alternativa de alto rendimiento y menor coste frente a los modelos insignia como Opus 4.8, GPT-5.5 y Gemini 3.1 Pro.
  • Seguridad mejorada: Las mejoras significativas en el rechazo de solicitudes maliciosas y la resistencia a las inyecciones de prompts lo hacen más seguro para los flujos de trabajo agénticos.