Anthropic Meluncurkan Claude Sonnet 5 untuk Mendukung Agen AI yang Terjangkau
Anthropic telah resmi merilis Claude Sonnet 5, sebuah model ukuran menengah yang dirancang khusus untuk menjembatani kesenjangan antara penalaran tingkat tinggi dan eksekusi otonom yang hemat biaya. Dengan memprioritaskan kemampuan "agentic"—kemampuan untuk menggunakan alat, merencanakan, dan melakukan iterasi—Anthropic memposisikan Sonnet 5 sebagai mesin utama bagi para pengembang yang membangun alur kerja otomatis.
Pergeseran Menuju Kecerdasan Agentic
Dalam perlombaan senjata AI saat ini, industri sedang bergerak melampaui chatbot sederhana menuju agen otonom. Rilis Anthropic ini mengikuti langkah serupa dari OpenAI dengan GPT-5.6 Sol dan Google dengan Gemini 3.5 Flash, yang menandakan bahwa performa agentic adalah standar baru.
Claude Sonnet 5 dirancang untuk bertindak sebagai operator otonom, yang mampu menggunakan browser dan terminal untuk mengeksekusi tugas multi-langkah. Berbeda dengan iterasi sebelumnya yang mungkin terhenti saat menghadapi urutan yang kompleks, Sonnet 5 menunjukkan kemampuan unik untuk "memeriksa outputnya sendiri" dan menyelesaikan alur kerja dari awal hingga akhir. Sebagai contoh, para insinyur Zapier mencatat bahwa model ini berhasil menyelesaikan tugas dua bagian—memperbarui tingkatan akun Salesforce dan mengirimkan pengumuman peluncuran perusahaan—sebuah proses yang sebelumnya menyebabkan model-model terdahulu gagal di tengah jalan.
Tolok Ukur Performa: Menandingi Para Pemain Besar
Meskipun Sonnet 5 adalah model ukuran menengah, metrik performanya mendekati model unggulan Anthropic, Opus 4.8. Pada tolok ukur pengodean agentic, Sonnet 5 meraih skor 63,2%, jauh lebih tinggi daripada pendahulunya Sonnet 4.6 (58,1%), dan hanya tertinggal sedikit di belakang Opus 4.8 (69,2%).
Luar biasanya, dalam tolok ukur pekerjaan pengetahuan tertentu, Sonnet 5 justru mengungguli Opus 4.8. Hal ini menjadikannya pilihan yang sangat efisien bagi pengembang yang membutuhkan penalaran mendalam tanpa harga premium dari model kelas atas. Anthropic menyarankan bahwa meskipun Opus 4.8 tetap menjadi standar untuk akurasi ekstrem dan penilaian yang halus, Sonnet 5 menawarkan keseimbangan ideal antara kualitas dan biaya untuk otomatisasi sehari-hari.
Harga yang Agresif dan Standar Keamanan
Untuk mendorong adopsi, Anthropic telah memperkenalkan struktur harga yang kompetitif. Hingga 31 Agustus, Sonnet 5 dibanderol seharga $2 per satu juta token input dan $10 per satu juta token output. Setelah periode ini, harga akan disesuaikan menjadi $3 per satu juta token input dan $15 per satu juta token output. Penempatan posisi ini membuat Sonnet 5 lebih terjangkau daripada GPT-5.5 milik OpenAI dan Gemini 3.1 Pro milik Google, meskipun tetap lebih mahal daripada Gemini 3.5 Flash.
Keamanan juga sama pentingnya dalam penerapan agentic, di mana kemampuan model untuk menolak perintah berbahaya sangatlah krusial. Sonnet 5 menunjukkan penurunan tingkat "perilaku yang tidak diinginkan," seperti penipuan atau kerja sama dalam penyalahgunaan, dibandingkan dengan Sonnet 4.6. Model ini juga menunjukkan ketahanan yang lebih baik terhadap serangan prompt-injection dan tingkat perilaku sycophantic yang lebih rendah, menjadikannya mitra yang lebih andal bagi para pengembang yang menyebarkan alat ke jutaan pengguna.
Poin-Poin Penting
- Fokus Agentic: Sonnet 5 dioptimalkan untuk tugas-tugas otonom, termasuk penggunaan alat (browser/terminal) dan koreksi mandiri, menjadikannya ideal untuk otomatisasi yang kompleks.
- Efisiensi Biaya: Model ini menawarkan alternatif berkinerja tinggi dengan biaya lebih rendah dibandingkan model unggulan seperti Opus 4.8, GPT-5.5, dan Gemini 3.1 Pro.
- Keamanan yang Ditingkatkan: Peningkatan signifikan dalam menolak permintaan berbahaya dan menahan prompt injection membuatnya lebih aman untuk alur kerja agentic.
