Anthropic lanceert Claude Sonnet 5 voor betaalbare AI-agents

Anthropic heeft officieel Claude Sonnet 5 uitgebracht, een midsize model dat specifiek is ontworpen om de kloof te overbruggen tussen hoogwaardige redenering en kosteneffectieve autonome uitvoering. Door prioriteit te geven aan "agentic" capaciteiten — het vermogen om tools te gebruiken, te plannen en te itereren — positioneert Anthropic Sonnet 5 als de standaardmotor voor ontwikkelaars die geautomatiseerde workflows bouwen.

De verschuiving naar agentic intelligentie

In de huidige AI-wapenwedloop beweegt de industrie zich verder dan eenvoudige chatbots richting autonome agents. De release van Anthropic volgt vergelijkbare stappen van OpenAI met GPT-5.6 Sol en Google met Gemini 3.5 Flash, wat aangeeft dat agentic performance de nieuwe standaard is.

Claude Sonnet 5 is ontworpen om te fungeren als een autonome operator, in staat om browsers en terminals te gebruiken om taken met meerdere stappen uit te voeren. In tegenstelling tot eerdere iteraties die kunnen vastlopen tijdens complexe sequenties, vertoont Sonnet 5 een uniek vermogen om "zijn eigen output te controleren" en end-to-end workflows te voltooien. Zo merkten ingenieurs van Zapier op dat het model succesvol een taak in twee delen voltooide — het bijwerken van Salesforce-accountniveaus en het versturen van aankondigingen voor enterprise-lanceringen — een proces waarbij eerdere modellen halverwege faalden.

Performance Benchmarks: De zwaargewichten evenaren

Hoewel Sonnet 5 een midsize model is, benaderen de prestatiecijfers die van Anthropic's vlaggenschip, Opus 4.8. Op agentic coding benchmarks scoorde Sonnet 5 63,2%, aanzienlijk hoger dan zijn voorganger Sonnet 4.6 (58,1%), en bleef hij slechts een klein beetje achter bij Opus 4.8 (69,2%).

Opmerkelijk genoeg presteerde Sonnet 5 in specifieke benchmarks voor kenniswerk zelfs beter dan Opus 4.8. Dit maakt het een zeer efficiënte keuze voor ontwikkelaars die diepgaande redenering nodig hebben zonder de premium prijs van een topmodel. Anthropic suggereert dat hoewel Opus 4.8 de standaard blijft voor extreme nauwkeurigheid en subtiel oordeelsvermogen, Sonnet 5 de ideale balans biedt tussen kwaliteit en kosten voor dagelijkse automatisering.

Agressieve prijsstelling en veiligheidsnormen

Om adoptie te stimuleren, heeft Anthropic een concurrerende prijsstructuur geïntroduceerd. Tot en met 31 augustus is de prijs van Sonnet 5 $2 per miljoen input tokens en $10 per miljoen output tokens. Na deze periode zullen de prijzen worden aangepast naar $3 per miljoen input tokens en $15 per miljoen output tokens. Door deze positionering is Sonnet 5 betaalbaarder dan OpenAI's GPT-5.5 en Google's Gemini 3.1 Pro, hoewel het duurder blijft dan Gemini 3.5 Flash.

Veiligheid is even cruciaal bij agentic deployments, waarbij het vermogen van een model om kwaadaardige commando's te weigeren van groot belang is. Sonnet 5 vertoont een verminderde mate van "ongewenst gedrag", zoals misleiding of medewerking aan misbruik, vergeleken met Sonnet 4.6. Het heeft ook een verbeterde weerstand tegen prompt-injection aanvallen en een lager percentage sycophantisch gedrag laten zien, waardoor het een betrouwbaardere partner is voor bouwers die tools uitrollen naar miljoenen gebruikers.

Kernpunten

  • Agentic Focus: Sonnet 5 is geoptimaliseerd voor autonome taken, inclusief toolgebruik (browsers/terminals) en zelfcorrectie, wat het ideaal maakt voor complexe automatisering.
  • Kostenefficiëntie: Het model biedt een hoogwaardig, goedkoper alternatief voor vlaggenschipmodellen zoals Opus 4.8, GPT-5.5 en Gemini 3.1 Pro.
  • Verbeterde veiligheid: Significante verbeteringen in het weigeren van kwaadaardige verzoeken en het weerstaan van prompt injections maken het veiliger voor agentic workflows.