Anthropic Melancarkan Claude Sonnet 5 untuk Memacu Ejen AI yang Mampu Milik

Anthropic telah melancarkan Claude Sonnet 5 secara rasmi, sebuah model bersaiz sederhana yang direka khusus untuk merapatkan jurang antara penaakulan tahap tinggi dan pelaksanaan autonomi yang kos efektif. Dengan mengutamakan keupayaan "agentic"—iaitu keupayaan untuk menggunakan alatan, merancang, dan melakukan iterasi—Anthropic meletakkan Sonnet 5 sebagai enjin utama bagi pembangun yang membina aliran kerja automatik.

Peralihan ke arah Kecerdasan Agentic

Dalam perlumbaan senjata AI semasa, industri kini beralih daripada bot sembang ringkas kepada ejen autonomi. Pelancaran Anthropic ini menyusuli langkah serupa daripada OpenAI dengan GPT-5.6 Sol dan Google dengan Gemini 3.5 Flash, menandakan bahawa prestasi agentic adalah piawaian baharu.

Claude Sonnet 5 direka untuk bertindak sebagai pengendali autonomi, yang mampu menggunakan pelayar dan terminal untuk melaksanakan tugas pelbagai langkah. Tidak seperti iterasi sebelumnya yang mungkin terhenti semasa urutan kompleks, Sonnet 5 menunjukkan keupayaan unik untuk "menyemak outputnya sendiri" dan melengkapkan aliran kerja hujung-ke-hujung. Sebagai contoh, jurutera Zapier menyatakan bahawa model ini berjaya menyelesaikan tugas dua bahagian—mengemas kini tahap akaun Salesforce dan menghantar pengumuman pelancaran perusahaan—satu proses yang sebelum ini menyebabkan model terdahulu gagal di tengah jalan.

Penanda Aras Prestasi: Menandingi Gergasi Industri

Walaupun Sonnet 5 adalah model bersaiz sederhana, metrik prestasinya menghampiri model utama Anthropic, Opus 4.8. Dalam penanda aras pengekodan agentic, Sonnet 5 mencatatkan skor 63.2%, jauh lebih tinggi daripada pendahulunya Sonnet 4.6 (58.1%), dan hanya ketinggalan sedikit di belakang Opus 4.8 (69.2%).

Secara luar biasa, dalam penanda aras kerja pengetahuan tertentu, Sonnet 5 sebenarnya mengatasi Opus 4.8. Ini menjadikannya pilihan yang sangat cekap bagi pembangun yang memerlukan penaakulan mendalam tanpa harga premium model tahap tertinggi. Anthropic mencadangkan bahawa walaupun Opus 4.8 kekal sebagai piawaian untuk ketepatan ekstrem dan pertimbangan halus, Sonnet 5 menawarkan keseimbangan ideal antara kualiti dan kos untuk automasi harian.

Harga Agresif dan Piawaian Keselamatan

Untuk memacu penggunaan, Anthropic telah memperkenalkan struktur harga yang kompetitif. Sehingga 31 Ogos, Sonnet 5 berharga $2 bagi setiap satu juta token input dan $10 bagi setiap satu juta token output. Selepas tempoh ini, harga akan diselaraskan kepada $3 bagi setiap satu juta token input dan $15 bagi setiap satu juta token output. Kedudukan ini menjadikan Sonnet 5 lebih mampu milik berbanding GPT-5.5 milik OpenAI dan Gemini 3.1 Pro milik Google, walaupun ia kekal lebih mahal daripada Gemini 3.5 Flash.

Keselamatan adalah sama penting dalam penggunaan agentic, di mana keupayaan model untuk menolak arahan berniat jahat adalah sangat utama. Sonnet 5 menunjukkan kadar "tingkah laku yang tidak diingini" yang berkurangan, seperti penipuan atau kerjasama dalam penyalahgunaan, berbanding Sonnet 4.6. Ia juga telah menunjukkan daya tahan yang lebih baik terhadap serangan suntikan arahan (prompt-injection) dan kadar tingkah laku penjilat (sycophantic) yang lebih rendah, menjadikannya rakan kongsi yang lebih dipercayai bagi pembangun yang melancarkan alatan kepada jutaan pengguna.

Ringkasan Utama

  • Fokus Agentic: Sonnet 5 dioptimumkan untuk tugas autonomi, termasuk penggunaan alatan (pelayar/terminal) dan pembetulan kendiri, menjadikannya ideal untuk automasi kompleks.
  • Kecekapan Kos: Model ini menawarkan alternatif berprestasi tinggi dan kos lebih rendah berbanding model utama seperti Opus 4.8, GPT-5.5, dan Gemini 3.1 Pro.
  • Keselamatan Dipertingkat: Penambahbaikan ketara dalam menolak permintaan berniat jahat dan menangkis suntikan arahan menjadikannya lebih selamat untuk aliran kerja agentic.