Anthropic ने लाँच केले Claude Sonnet 5: Agentic AI चे नवीन क्षितिज

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial३ दिवसांपूर्वी3min read

Anthropic ने लाँच केले Claude Sonnet 5: Agentic AI चे नवीन क्षितिज

In this article

Anthropic ने Claude Sonnet 5 लाँच केले: Agentic AI चे नवीन क्षितिज

Anthropic ने अधिकृतपणे Claude Sonnet 5 लाँच केले आहे, जे mid-tier आणि flagship AI सिरीजमधील कामगिरीतील अंतर कमी करण्यासाठी डिझाइन केलेले एक शक्तिशाली मॉडेल आहे. Agentic क्षमतांना—म्हणजेच साधने वापरणे, ब्राउझ करणे आणि जटिल योजना कार्यान्वित करणे—प्राधान्य देऊन, हे रिलीज स्वायत्त (autonomous) AI वर्कफ्लोच्या दिशेने होणाऱ्या बदलाचे संकेत देते.

Opus सिरीजसोबतचे अंतर कमी करणे

Sonnet 5 चा सर्वात लक्षवेधी पैलू म्हणजे ते किती जवळून अधिक मोठ्या आणि महागड्या Opus 4.8 च्या कामगिरीला स्पर्श करते. क्रांतिकारी बेंचमार्क मध्ये, Sonnet 5 ने हे सिद्ध केले आहे की "मध्यम आकाराची" मॉडेल्स आता अशा कामांना सामोरे जाऊ शकतात जी पूर्वी केवळ frontier-class इंटेलिजन्ससाठी राखीव होती.

बहुविद्याशाखीय तर्कशुद्धता (multidisciplinary reasoning) बेंचमार्क, Humanity's Last Exam वर, Sonnet 5 ने साधने वापरून ५७.४% गुण मिळवले, जे Opus 4.8 च्या ५७.९% गुणांच्या जवळ आहे. सर्वात प्रभावी बाब म्हणजे, वास्तविक जगातील ज्ञान कार्य बेंचमार्क GDPval-AA v2 वर, Sonnet 5 ने प्रत्यक्षात Opus 4.8 ला मागे टाकले, आणि flagship च्या १,६१५ गुणांच्या तुलनेत १,६१८ गुण मिळवले. हे सूचित करते की विशिष्ट ज्ञान-प्रधान वर्कफ्लोसाठी, Sonnet 5 ची कार्यक्षमता Opus सिरीजच्या प्रचंड व्याप्तीपेक्षा अधिक फायदेशीर ठरू शकते.

Agentic कामगिरीमध्ये मोठी झेप

Anthropic ने Sonnet 5 ला आतापर्यंतचे सर्वात "agentic" मॉडेल म्हणून विशेषतः विकसित केले आहे. याचा अर्थ असा की हे मॉडेल बहु-स्तरीय उद्दिष्टे पूर्ण करण्यासाठी वेब ब्राउझर आणि टर्मिनल्स सारख्या वातावरणाशी संवाद साधण्यासाठी ऑप्टिमाइझ केलेले आहे. डेटा त्याच्या पूर्ववर्ती, Sonnet 4.6 च्या तुलनेत मोठी झेप दर्शवतो:

SWE-bench Pro (Agentic Coding): Sonnet 5 ने ६३.२% पर्यंत मजल मारली, जी Sonnet 4.6 मधील ५८.१% होती (Opus 4.8 च्या ६९.२% च्या तुलनेत).
Terminal-Bench 2.1: Sonnet 4.6 च्या ६७.०% च्या तुलनेत ८०.४% पर्यंत मोठी झेप.
OSWorld-Verified (Computer Use): मॉडेलने ८१.२% गुण मिळवले, जे मागील आवृत्तीने नोंदवलेल्या ७८.५% पेक्षा जास्त आहे.

सायबर सुरक्षा आणि सुरक्षिततेच्या मर्यादांचे व्यवस्थापन

सायबर सुरक्षेच्या कारणास्तव अमेरिकन सरकारकडून त्यांच्या Mythos 5 आणि Fable 5 मॉडेल्सवर घातलेल्या निर्बंधांनंतर, Anthropic साठी हे लाँच एका संवेदनशील काळात होत आहे. अशाच प्रकारच्या अडथळ्या टाळण्यासाठी, Anthropic ने हे सुनिश्चित केले आहे की Sonnet 5 ला विशेष सायबर सुरक्षा कार्यांवर प्रशिक्षित केले गेलेले नाही.

जरी Sonnet 5 ने exploit evaluations मध्ये Sonnet 4.6 पेक्षा थोडी जास्त partial control rate (१३.२%) दर्शवली असली, तरी सॉफ्टवेअर exploits लिहिण्याच्या बाबतीत ते Opus 4.8 किंवा Mythos 5 पेक्षा लक्षणीयरीत्या कमी सक्षम आहे. जोखीम कमी करण्यासाठी, Anthropic ने डिफॉल्टनुसार रिअल-टाइम सायबर सुरक्षा उपाय लागू केले आहेत, तसेच prompt injection विरुद्ध सुधारित संरक्षण आणि "sycophantic" वर्तणुकीत (वापरकर्त्याच्या चुकांशी केवळ सहमत होण्याची प्रवृत्ती) घट केली आहे.

उपलब्धता आणि "Token Paradox"

Claude Sonnet 5 आता Claude Platform आणि API (claude-sonnet-5 म्हणून) द्वारे उपलब्ध आहे, ज्यामध्ये १० लाख टोकन कॉन्टेक्स्ट विंडो आणि जानेवारी २०२६ पर्यंतचा ट्रेनिंग कटऑफ आहे.

जरी Anthropic ३१ ऑगस्ट २०२६ पर्यंत सुरुवातीची किंमत—प्रति १० लाख इनपुट टोकन्ससाठी $२ आणि प्रति १० लाख आउटपुट टोकन्ससाठी $१०—देत असले तरी, डेव्हलपर्सनी "token paradox" बद्दल सावध राहिले पाहिजे. मॉडेल अधिक agentic असल्याने आणि अधिक पुनरावृत्तीक्षम (iterative) तर्कशुद्धतेमध्ये गुंतलेले असल्याने, ते मागील आवृत्त्यांच्या तुलनेत एक कार्य पूर्ण करण्यासाठी लक्षणीयरीत्या जास्त टोकन्स वापरू शकते, ज्यामुळे प्रति-टोकन कमी खर्च असूनही एकूण खर्च वाढू शकतो.

मुख्य निष्कर्ष

Performance Parity: Sonnet 5 विशिष्ट तर्कशुद्धता आणि ज्ञान कार्य बेंचमार्कमध्ये flagship Opus 4.8 च्या बरोबरीने येते किंवा त्याला मागे टाकते.
Agentic Focus: मॉडेल कोडिंग (SWE-bench) आणि टर्मिनल इंटरॅक्शनमध्ये प्रचंड सुधारणा दर्शवते, ज्यामुळे ते स्वायत्त साधन वापरासाठी (autonomous tool use) आदर्श ठरते.
Strategic Safety: Anthropic ने या मॉडेलला अधिक वादग्रस्त आणि उच्च-जोखीम असलेल्या frontier मॉडेल्सपासून वेगळे करण्यासाठी अंगभूत सायबर सुरक्षा उपायांना प्राधान्य दिले आहे.

Anthropic ने लाँच केले Claude Sonnet 5: Agentic AI चे नवीन क्षितिज

Anthropic ने Claude Sonnet 5 लाँच केले: Agentic AI चे नवीन क्षितिज

Opus सिरीजसोबतचे अंतर कमी करणे

Agentic कामगिरीमध्ये मोठी झेप

सायबर सुरक्षा आणि सुरक्षिततेच्या मर्यादांचे व्यवस्थापन

उपलब्धता आणि "Token Paradox"

मुख्य निष्कर्ष

Continue reading

Claude Sonnet 5: उच्च कार्यक्षमता किमतीतील मोठी वाढ लपवत आहे

Anthropic ने Claude Sonnet 5 लाँच केले आणि फ्रंटियर मॉडेल्स पुन्हा सुरू केले

औषध शोध प्रक्रियेत क्रांती घडवण्यासाठी Anthropic ने Claude Science लाँच केले

Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

Anthropic ने Claude Science लाँच केले: AI संशोधनासाठी 'वर्कफ्लो-फर्स्ट' दृष्टिकोन