Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 ദിവസം മുമ്പ്2min read

Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

In this article

കുറഞ്ഞ ചിലവിൽ AI ഏജന്റുകളെ പ്രവർത്തിപ്പിക്കാൻ Anthropic Claude Sonnet 5 പുറത്തിറക്കി

ഉയർന്ന നിലവാരത്തിലുള്ള യുക്തിചിന്തയും (reasoning) കുറഞ്ഞ ചിലവിലുള്ള സ്വയംഭരണാധികാര പ്രവർത്തനങ്ങളും (autonomous execution) തമ്മിലുള്ള അകലം കുറയ്ക്കുന്നതിനായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്ത ഒരു മിഡ്‌സൈസ് മോഡലായ Claude Sonnet 5 Anthropic ഔദ്യോഗികമായി പുറത്തിറക്കി. ടൂളുകൾ ഉപയോഗിക്കാനും പ്ലാൻ ചെയ്യാനും ആവർത്തിച്ചു പ്രവർത്തിക്കാനുമുള്ള "ഏജന്റിക്" (agentic) കഴിവുകൾക്ക് മുൻഗണന നൽകുന്നതിലൂടെ, ഓട്ടോമേറ്റഡ് വർക്ക്ഫ്ലോകൾ നിർമ്മിക്കുന്ന ഡെവലപ്പർമാർക്ക് അനുയോജ്യമായ ഒരു എഞ്ചിനായി Anthropic Sonnet 5-നെ മാറ്റിയെടുക്കുകയാണ്.

ഏജന്റിക് ഇന്റലിജൻസിലേക്കുള്ള മാറ്റം

നിലവിലെ AI മത്സരത്തിൽ, വ്യവസായം ലളിതമായ ചാറ്റ്‌ബോട്ടുകളിൽ നിന്ന് സ്വയംഭരണാധികാരമുള്ള ഏജന്റുകളിലേക്ക് (autonomous agents) മാറിക്കൊണ്ടിരിക്കുകയാണ്. OpenAI-യുടെ GPT-5.6 Sol, Google-ന്റെ Gemini 3.5 Flash എന്നിവയുടെ നീക്കങ്ങൾക്ക് പിന്നാലെയാണ് Anthropic-ന്റെ ഈ പുതിയ പുറത്തിറക്കൽ. ഏജന്റിക് പ്രകടനം എന്നത് പുതിയ മാനദണ്ഡമായി മാറിക്കൊണ്ടിരിക്കുകയാണെന്ന് ഇത് സൂചിപ്പിക്കുന്നു.

ബ്രൗസറുകളും ടെർമിനലുകളും ഉപയോഗിച്ച് ബഹുതല ജോലികൾ (multi-step tasks) നിർവഹിക്കാൻ ശേഷിയുള്ള ഒരു സ്വയംഭരണാധികാര ഓപ്പറേറ്ററായി പ്രവർത്തിക്കാൻ Claude Sonnet 5 രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. സങ്കീർണ്ണമായ ഘട്ടങ്ങളിൽ തടസ്സപ്പെടാറുള്ള മുൻപത്തെ പതിപ്പുകളിൽ നിന്ന് വ്യത്യസ്തമായി, സ്വന്തം ഔട്ട്‌പുട്ട് പരിശോധിക്കാനും (check its own output) പൂർണ്ണമായ വർക്ക്ഫ്ലോകൾ പൂർത്തിയാക്കാനും Sonnet 5-ന് സവിശേഷമായ കഴിവുണ്ട്. ഉദാഹരണത്തിന്, Salesforce അക്കൗണ്ട് ടയറുകൾ അപ്‌ഡേറ്റ് ചെയ്യുക, എൻ്റർപ്രൈസ് ലോഞ്ച് അറിയിപ്പുകൾ അയക്കുക എന്നിങ്ങനെ രണ്ട് ഘട്ടങ്ങളുള്ള ഒരു ജോലി ഈ മോഡൽ വിജയകരമായി പൂർത്തിയാക്കിയതായി Zapier എഞ്ചിനീയർമാർ നിരീക്ഷിച്ചു. മുൻപത്തെ മോഡലുകൾ ഇത്തരം സാഹചര്യങ്ങളിൽ പകുതി വഴിയിൽ പരാജയപ്പെടാറാണ് പതിവ്.

പെർഫോമൻസ് ബെഞ്ച്മാർക്കുകൾ: കരുത്തരായ മോഡലുകളോട് കിടപിടിക്കുന്നു

Sonnet 5 ഒരു മിഡ്‌സൈസ് മോഡൽ ആണെങ്കിലും, ഇതിന്റെ പ്രകടനം Anthropic-ന്റെ ഏറ്റവും മികച്ച മോഡലായ Opus 4.8-നോട് അടുത്ത് നിൽക്കുന്നു. ഏജന്റിക് കോഡിംഗ് ബെഞ്ച്മാർക്കുകളിൽ Sonnet 5 63.2% സ്കോർ ചെയ്തു; ഇത് അതിന്റെ മുൻപത്തെ പതിപ്പായ Sonnet 4.6-നേക്കാൾ (58.1%) വളരെ കൂടുതലാണ്, കൂടാതെ Opus 4.8-ന് (69.2%) തൊട്ടുപിന്നിലുമാണ്.

ശ്രദ്ധേയമായ കാര്യം, ചില പ്രത്യേക നോളജ് വർക്ക് ബെഞ്ച്മാർക്കുകളിൽ Sonnet 5, Opus 4.8-നെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെച്ചു എന്നതാണ്. ഉയർന്ന വില നൽകാതെ തന്നെ ആഴത്തിലുള്ള യുക്തിചിന്ത (deep reasoning) ആവശ്യമുള്ള ഡെവലപ്പർമാർക്ക് ഇത് വളരെ കാര്യക്ഷമമായ ഒരു തിരഞ്ഞെടുപ്പാണ്. അങ്ങേയറ്റത്തെ കൃത്യതയ്ക്കും സൂക്ഷ്മമായ തീരുമാനങ്ങൾക്കും Opus 4.8 ഇപ്പോഴും മാനദണ്ഡമായി തുടരുമ്പോൾ, ദൈനംദിന ഓട്ടോമേഷന് ആവശ്യമായ ഗുണനിലവാരവും കുറഞ്ഞ ചിലവും Sonnet 5 വാഗ്ദാനം ചെയ്യുന്നുവെന്ന് Anthropic സൂചിപ്പിക്കുന്നു.

ആകർഷകമായ വിലയും സുരക്ഷാ മാനദണ്ഡങ്ങളും

കൂടുതൽ ആളുകളിലേക്ക് എത്തിക്കുന്നതിനായി Anthropic മത്സരബുദ്ധിയുള്ള ഒരു വിലനിർണ്ണയ രീതി അവതരിപ്പിച്ചു. ഓഗസ്റ്റ് 31 വരെ, Sonnet 5-ന് ഒരു മില്യൺ ഇൻപുട്ട് ടോക്കണുകൾക്ക് $2 ഡോളറും ഒരു മില്യൺ ഔട്ട്‌പുട്ട് ടോക്കണുകൾക്ക് $10 ഡോളറും ആണ് നിരക്ക്. ഈ കാലയളവിന് ശേഷം, ഇൻപുട്ട് ടോക്കണുകൾക്ക് $3 ഡോളറും ഔട്ട്‌പുട്ട് ടോക്കണുകൾക്ക് $15 ഡോളറും ആയി നിരക്ക് മാറും. ഈ വിലനിലവാരം Sonnet 5-നെ OpenAI-യുടെ GPT-5.5, Google-ന്റെ Gemini 3.1 Pro എന്നിവയേക്കാൾ കുറഞ്ഞ ചിലവുള്ളതാക്കുന്നു, എങ്കിലും Gemini 3.5 Flash-നേക്കാൾ ഇത് വില കൂടിയതാണ്.

ഏജന്റിക് സംവിധാനങ്ങളിൽ സുരക്ഷയ്ക്കും വലിയ പ്രാധാന്യമുണ്ട്; ദുരുദ്ദേശ്യപരമായ കമാൻഡുകൾ നിരസിക്കാനുള്ള മോഡലിന്റെ കഴിവ് ഇവിടെ വളരെ പ്രധാനമാണ്. Sonnet 4.6-നെ അപേക്ഷിച്ച്, വഞ്ചനയോ ദുരുപയോഗത്തോടുള്ള സഹകരണമോ പോലുള്ള "അഭികാമ്യമല്ലാത്ത പെരുമാറ്റങ്ങൾ" (undesirable behaviors) Sonnet 5-ൽ കുറവാണ്. കൂടാതെ, പ്രോംപ്റ്റ്-ഇൻജക്ഷൻ (prompt-injection) ആക്രമണങ്ങളെ പ്രതിരോധിക്കാനുള്ള ശേഷിയും, അമിതമായ അനുസരണാപരമായ പെരുമാറ്റം (sycophantic behavior) കുറയ്ക്കാനും ഇതിന് സാധിച്ചിട്ടുണ്ട്. ഇത് ദശലക്ഷക്കണക്കിന് ഉപയോക്താക്കൾക്കായി ടൂളുകൾ വികസിപ്പിക്കുന്നവർക്ക് കൂടുതൽ വിശ്വസനീയമായ ഒരു പങ്കാളിയാക്കുന്നു.

പ്രധാന കാര്യങ്ങൾ

ഏജന്റിക് ഫോക്കസ്: ടൂളുകൾ ഉപയോഗിക്കാനും (ബ്രൗസറുകൾ/ടെർമിനലുകൾ) സ്വയം തിരുത്തലുകൾ നടത്താനുമുള്ള കഴിവ് ഉൾപ്പെടെയുള്ള സ്വയംഭരണാധികാര ജോലികൾക്കായി Sonnet 5 ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു, ഇത് സങ്കീർണ്ണമായ ഓട്ടോമേഷന് അനുയോജ്യമാക്കുന്നു.
ചെലവ് കുറഞ്ഞ പ്രവർത്തനം: Opus 4.8, GPT-5.5, Gemini 3.1 Pro തുടങ്ങിയ ഫ്ലാഗ്ഷിപ്പ് മോഡലുകൾക്ക് പകരമായി ഉയർന്ന പ്രകടനവും കുറഞ്ഞ ചിലവുമുള്ള ഒരു ഓപ്ഷൻ ഈ മോഡൽ വാഗ്ദാനം ചെയ്യുന്നു.
മെച്ചപ്പെട്ട സുരക്ഷ: ദുരുദ്ദേശ്യപരമായ അഭ്യർത്ഥനകൾ നിരസിക്കുന്നതിലും പ്രോംപ്റ്റ് ഇൻജക്ഷനുകളെ പ്രതിരോധിക്കുന്നതിലും ഉണ്ടായ വലിയ പുരോഗതി ഏജന്റിക് വർക്ക്ഫ്ലോകൾക്ക് കൂടുതൽ സുരക്ഷ നൽകുന്നു.

Anthropic Launches Claude Sonnet 5 to Power Affordable AI Agents

കുറഞ്ഞ ചിലവിൽ AI ഏജന്റുകളെ പ്രവർത്തിപ്പിക്കാൻ Anthropic Claude Sonnet 5 പുറത്തിറക്കി

ഏജന്റിക് ഇന്റലിജൻസിലേക്കുള്ള മാറ്റം

പെർഫോമൻസ് ബെഞ്ച്മാർക്കുകൾ: കരുത്തരായ മോഡലുകളോട് കിടപിടിക്കുന്നു

ആകർഷകമായ വിലയും സുരക്ഷാ മാനദണ്ഡങ്ങളും

പ്രധാന കാര്യങ്ങൾ

Continue reading

Claude Sonnet 5: ഉയർന്ന പ്രകടനം വലിയ വില വർദ്ധനവിനെ മറച്ചുവെക്കുന്നു

Anthropic Launches Claude Sonnet 5 and Restores Frontier Models

Anthropic Launches Claude Science to Revolutionize Drug Discovery

Anthropic Launches Claude Sonnet 5: The New Frontier of Agentic AI

Anthropic Launches Claude Science: A Workflow First Approach to AI Research