Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial३ दिवसांपूर्वी2min read

Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

In this article

परवडणारे AI Agents सक्षम करण्यासाठी Anthropic ने Claude Sonnet 5 लाँच केले

Anthropic ने अधिकृतपणे Claude Sonnet 5 लाँच केले आहे, जे एक मध्यम आकाराचे (midsize) मॉडेल असून उच्च-स्तरीय तर्कशक्ती (high-end reasoning) आणि किफायतशीर स्वायत्त अंमलबजावणी (cost-effective autonomous execution) यांच्यातील अंतर कमी करण्यासाठी विशेषतः तयार करण्यात आले आहे. "agentic" क्षमतांना—म्हणजेच साधने वापरणे, नियोजन करणे आणि पुनरावृत्ती करणे (iterate) करण्याची क्षमता—प्राधान्य देऊन, Anthropic Sonnet 5 ला स्वयंचलित वर्कफ्लो (automated workflows) तयार करणाऱ्या डेव्हलपर्ससाठी एक प्रमुख इंजिन म्हणून प्रस्थापित करत आहे.

Agentic Intelligence कडे होणारे वळण

सध्याच्या AI शर्यतीत, उद्योग साध्या चॅटबॉट्सच्या पलीकडे जाऊन स्वायत्त एजंट्सकडे (autonomous agents) वळत आहे. Anthropic चे हे प्रकाशन OpenAI कडील GPT-5.6 Sol आणि Google कडील Gemini 3.5 Flash सारख्याच हालचालींचे अनुसरण करते, जे हे सूचित करते की 'agentic performance' हे आता नवीन मानक (baseline) बनत आहे.

Claude Sonnet 5 हे एका स्वायत्त ऑपरेटरप्रमाणे काम करण्यासाठी डिझाइन केलेले आहे, जे बहु-स्तरीय कार्ये (multi-step tasks) पूर्ण करण्यासाठी ब्राउझर्स आणि टर्मिनल्सचा वापर करण्यास सक्षम आहे. गुंतागुंतीच्या प्रक्रियेदरम्यान अडखळणाऱ्या मागील आवृत्त्यांच्या उलट, Sonnet 5 मध्ये स्वतःचे आउटपुट "तपासण्याची" (check its own output) आणि एंड-टू-एंड वर्कफ्लो पूर्ण करण्याची एक अद्वितीय क्षमता दिसून येते. उदाहरणार्थ, Zapier च्या इंजिनिअर्सनी असे नमूद केले की या मॉडेलने दोन भागांचे काम यशस्वीरित्या पूर्ण केले—Salesforce अकाउंट टियर्स अपडेट करणे आणि एंटरप्राइझ लॉन्च घोषणा पाठवणे—ही अशी प्रक्रिया होती जी पूर्वीच्या मॉडेल्समध्ये अर्धवट थांबत असे.

परफॉर्मन्स बेंचमार्क: दिग्गज मॉडेल्सना टक्कर

जरी Sonnet 5 हे मध्यम आकाराचे मॉडेल असले, तरी त्याचे परफॉर्मन्स मेट्रिक्स Anthropic च्या फ्लॅगशिप मॉडेल, Opus 4.8 च्या जवळ जाणारे आहेत. Agentic कोडिंग बेंचमार्कवर, Sonnet 5 ने 63.2% गुण मिळवले, जे त्याच्या मागील आवृत्ती Sonnet 4.6 (58.1%) पेक्षा लक्षणीयरीत्या जास्त आहेत आणि केवळ Opus 4.8 (69.2%) च्या थोड्या मागे आहेत.

विशेष म्हणजे, विशिष्ट नॉलेज वर्क बेंचमार्कमध्ये, Sonnet 5 ने प्रत्यक्षात Opus 4.8 पेक्षा सरस कामगिरी केली आहे. यामुळे, ज्या डेव्हलपर्सना टॉप-टियर मॉडेलच्या महागड्या किमतीशिवाय सखोल तर्कशक्तीची (deep reasoning) गरज आहे, त्यांच्यासाठी हे एक अत्यंत कार्यक्षम पर्याय ठरते. Anthropic चे असे म्हणणे आहे की, जरी Opus 4.8 हे अत्यंत अचूकता आणि सूक्ष्म निर्णयांसाठी मानक राहिले असले, तरी Sonnet 5 दैनंदिन ऑटोमेशनसाठी गुणवत्ता आणि खर्च यांचा आदर्श समतोल प्रदान करते.

आक्रमक किंमत आणि सुरक्षा मानके

वापर वाढवण्यासाठी, Anthropic ने स्पर्धात्मक किंमत संरचना (pricing structure) आणली आहे. ३१ ऑगस्टपर्यंत, Sonnet 5 ची किंमत प्रति दशलक्ष इनपुट टोकन्ससाठी $2 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $10 आहे. या कालावधीनंतर, किमती बदलून प्रति दशलक्ष इनपुट टोकन्ससाठी $3 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $15 होतील. या धोरणामुळे Sonnet 5 हे OpenAI च्या GPT-5.5 आणि Google च्या Gemini 3.1 Pro पेक्षा अधिक परवडणारे ठरते, तरीही ते Gemini 3.5 Flash पेक्षा महाग आहे.

Agentic उपयोजनांमध्ये (deployments) सुरक्षा तितकीच महत्त्वाची आहे, जिथे मॉडेलची घातक कमांड्स नाकारण्याची क्षमता अत्यंत आवश्यक असते. Sonnet 4.6 च्या तुलनेत Sonnet 5 मध्ये "अवांछित वर्तनांचे" (undesirable behaviors) प्रमाण कमी दिसून येते, जसे की फसवणूक किंवा गैरवापरामध्ये सहकार्य करणे. याशिवाय, या मॉडेलने प्रॉम्प्ट-इंजेक्शन (prompt-injection) हल्ल्यांविरुद्ध सुधारित लवचिकता आणि कमी 'sycophantic' (वापरकर्त्याच्या मताशी केवळ सहमत होणारे) वर्तन प्रदर्शित केले आहे, ज्यामुळे लाखो वापरकर्त्यांसाठी टूल्स तैनात करणाऱ्या बिल्डर्ससाठी ते अधिक विश्वासार्ह भागीदार ठरते.

मुख्य निष्कर्ष

Agentic फोकस: Sonnet 5 हे स्वायत्त कार्यांसाठी ऑप्टिमाइझ केलेले आहे, ज्यामध्ये टूल्सचा वापर (browsers/terminals) आणि सेल्फ-करेक्शनचा समावेश आहे, ज्यामुळे ते गुंतागुंतीच्या ऑटोमेशनसाठी आदर्श ठरते.
किफायतशीरपणा (Cost-Efficiency): हे मॉडेल Opus 4.8, GPT-5.5 आणि Gemini 3.1 Pro सारख्या फ्लॅगशिप मॉडेल्सना उच्च-कार्यक्षमता आणि कमी खर्चाचा पर्याय देते.
सुधारित सुरक्षा: घातक विनंत्या नाकारण्यात आणि प्रॉम्प्ट इंजेक्शन्सचा प्रतिकार करण्यात झालेल्या महत्त्वपूर्ण सुधारणांमुळे ते agentic वर्कफ्लोसाठी अधिक सुरक्षित बनले आहे.

Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

परवडणारे AI Agents सक्षम करण्यासाठी Anthropic ने Claude Sonnet 5 लाँच केले

Agentic Intelligence कडे होणारे वळण

परफॉर्मन्स बेंचमार्क: दिग्गज मॉडेल्सना टक्कर

आक्रमक किंमत आणि सुरक्षा मानके

मुख्य निष्कर्ष

Continue reading

Claude Sonnet 5: उच्च कार्यक्षमता किमतीतील मोठी वाढ लपवत आहे

Anthropic ने Claude Sonnet 5 लाँच केले आणि फ्रंटियर मॉडेल्स पुन्हा सुरू केले

औषध शोध प्रक्रियेत क्रांती घडवण्यासाठी Anthropic ने Claude Science लाँच केले

Anthropic ने लाँच केले Claude Sonnet 5: Agentic AI चे नवीन क्षितिज

Anthropic ने Claude Science लाँच केले: AI संशोधनासाठी 'वर्कफ्लो-फर्स्ट' दृष्टिकोन