Anthropic veröffentlicht Claude Sonnet 5: Die neue Grenze der agentischen KI
Anthropic hat offiziell Claude Sonnet 5 veröffentlicht, ein leistungsstarkes Modell, das darauf ausgelegt ist, die Leistungslücke zwischen Mittelklasse- und Flaggschiff-KI-Serien zu schließen. Durch die Priorisierung agentischer Fähigkeiten – die Fähigkeit, Werkzeuge zu nutzen, zu browsen und komplexe Pläne auszuführen – signalisiert diese Veröffentlichung eine Verschiebung hin zu autonomen KI-Workflows.
Die Lücke zur Opus-Serie schließen
Der auffälligste Aspekt von Sonnet 5 ist, wie nah es der Leistung des wesentlich größeren und teureren Opus 4.8 kommt. In bahnbrechenden Benchmarks hat Sonnet 5 gezeigt, dass „mittelgroße“ Modelle nun Aufgaben bewältigen können, die zuvor der Frontier-Klasse der Intelligenz vorbehalten waren.
Beim multidisziplinären Reasoning-Benchmark Humanity's Last Exam erreichte Sonnet 5 unter Verwendung von Werkzeugen einen Wert von 57,4 % und erreichte damit fast den Wert von 57,9 % von Opus 4.8. Am beeindruckendsten war jedoch, dass Sonnet 5 beim Benchmark für realweltliche Wissensaufgaben GDPval-AA v2 Opus 4.8 tatsächlich übertraf und 1.618 Punkte gegenüber den 1.615 Punkten des Flaggschiffs erzielte. Dies deutet darauf hin, dass bei spezifischen, wissensintensiven Workflows die Effizienz von Sonnet 5 die reine Skalierbarkeit der Opus-Serie überwiegen könnte.
Ein gewaltiger Sprung in der agentischen Leistung
Anthropic hat Sonnet 5 gezielt als sein bisher „agentischstes“ Modell entwickelt. Das bedeutet, dass das Modell für die Interaktion mit Umgebungen wie Webbrowsern und Terminals optimiert ist, um mehrstufige Ziele zu erreichen. Die Daten zeigen einen signifikanten Sprung gegenüber dem Vorgänger Sonnet 4.6:
- SWE-bench Pro (Agentic Coding): Sonnet 5 erreichte 63,2 %, gegenüber 58,1 % bei Sonnet 4.6 (hinter Opus 4.8 mit 69,2 %).
- Terminal-Bench 2.1: Ein gewaltiger Sprung auf 80,4 %, verglichen mit 67,0 % bei Sonnet 4.6.
- OSWorld-Verified (Computer Use): Das Modell erzielte 81,2 % und übertraf damit die 78,5 % der Vorgängerversion.
Umgang mit Cybersicherheits- und Sicherheitsbeschränkungen
Die Veröffentlichung erfolgt zu einem sensiblen Zeitpunkt für Anthropic, nach US-Regierungsbeschränkungen für die Modelle Mythos 5 und Fable 5 aufgrund von Bedenken hinsichtlich der Cybersicherheit. Um ähnliche Hürden zu vermeiden, hat Anthropic sichergestellt, dass Sonnet 5 nicht auf spezialisierten Cybersicherheitsaufgaben trainiert wurde.
Obwohl Sonnet 5 bei Exploit-Evaluierungen eine etwas höhere Teilkontrollrate (13,2 %) aufweist als Sonnet 4.6, ist es beim Schreiben von Software-Exploits immer noch deutlich weniger fähig als Opus 4.8 oder Mythos 5. Um Risiken zu minimieren, hat Anthropic standardmäßig Echtzeit-Cybersicherheitsmaßnahmen implementiert, zusammen mit verbesserten Abwehrmechanismen gegen Prompt Injection und einer Reduzierung von „sycophantischem“ Verhalten (der Tendenz, Benutzerfehlern einfach zuzustimmen).
Verfügbarkeit und das „Token-Paradoxon“
Claude Sonnet 5 ist ab sofort über die Claude Platform und die API (als claude-sonnet-5) verfügbar und verfügt über ein Kontextfenster von einer Million Token sowie einen Trainings-Cutoff vom Januar 2026.
Während Anthropic Einführungsangebote anbietet – 2 $ pro Million Input-Token und 10 $ pro Million Output-Token bis zum 31. August 2026 – sollten Entwickler auf das „Token-Paradoxon“ achten. Da das Modell agentischer ist und mehr iteratives Reasoning betreibt, könnte es für den Abschluss einer einzelnen Aufgabe deutlich mehr Token verbrauchen als vorherige Versionen, was die niedrigeren Kosten pro Token potenziell wieder ausgleichen könnte.
Die wichtigsten Erkenntnisse
- Leistungs-Parität: Sonnet 5 erreicht oder übertrifft das Flaggschiff Opus 4.8 in spezifischen Reasoning- und Wissens-Benchmarks.
- Agentischer Fokus: Das Modell zeigt massive Verbesserungen beim Coding (SWE-bench) und bei der Terminal-Interaktion, was es ideal für die autonome Werkzeugnutzung macht.
- Strategische Sicherheit: Anthropic hat integrierte Cybersicherheitsmaßnahmen priorisiert, um dieses Modell von umstritteneren, hochriskanten Frontier-Modellen abzugrenzen.
