மலிவு விலையிலான AI ஏஜெண்டுகளை இயக்க Anthropic நிறுவனம் Claude Sonnet 5-ஐ அறிமுகப்படுத்துகிறது
உயர்தரத் தர்க்கரீதியான சிந்தனைக்கும் (high-end reasoning) செலவு குறைந்த தன்னாட்சிச் செயல்பாட்டிற்கும் (cost-effective autonomous execution) இடையிலான இடைவெளியைக் குறைக்கும் வகையில் பிரத்யேகமாக வடிவமைக்கப்பட்ட ஒரு நடுத்தர அளவிலான மாடலான Claude Sonnet 5-ஐ Anthropic அதிகாரப்பூர்வமாக வெளியிட்டுள்ளது. கருவிகளைப் பயன்படுத்துதல், திட்டமிடுதல் மற்றும் மீண்டும் மீண்டும் செயல்படுதல் போன்ற "ஏஜென்டிக்" (agentic) திறன்களுக்கு முன்னுரிமை அளிப்பதன் மூலம், தானியங்கி பணிப்பாய்வுகளை (automated workflows) உருவாக்கும் டெவலப்பர்களுக்கான முதன்மையான இயந்திரமாக Sonnet 5-ஐ Anthropic முன்னிறுத்துகிறது.
ஏஜென்டிக் நுண்ணறிவை நோக்கிய மாற்றம்
தற்போதைய AI போட்டியில், இந்தத் துறை சாதாரண சாட்பாட்களைத் தாண்டி தன்னாட்சி ஏஜெண்டுகளை (autonomous agents) நோக்கி நகர்ந்து வருகிறது. OpenAI-ன் GPT-5.6 Sol மற்றும் Google-ன் Gemini 3.5 Flash ஆகியவற்றின் நகர்வுகளைத் தொடர்ந்து Anthropic இந்த வெளியீட்டை மேற்கொண்டுள்ளது; இது ஏஜென்டிக் செயல்திறன் என்பது புதிய அடிப்படையாகும் (new baseline) என்பதைக் காட்டுகிறது.
Claude Sonnet 5 ஒரு தன்னாட்சி இயக்குநராகச் செயல்படும் வகையில் வடிவமைக்கப்பட்டுள்ளது, இது பல படிநிலைகளைக் கொண்ட பணிகளைச் செய்ய பிரவுசர்கள் (browsers) மற்றும் டெர்மினல்களைப் (terminals) பயன்படுத்தும் திறன் கொண்டது. சிக்கலான வரிசைகளின் போது முடங்கிப்போகக்கூடிய முந்தைய பதிப்புகளைப் போலல்லாமல், Sonnet 5 தனது சொந்த வெளியீட்டைச் சரிபார்க்கும் ("check its own output") மற்றும் முழுமையான பணிப்பாய்வுகளை (end-to-end workflows) முடிக்கும் தனித்துவமான திறனை வெளிப்படுத்துகிறது. உதாரணமாக, Salesforce கணக்கு நிலைகளை (account tiers) புதுப்பித்தல் மற்றும் நிறுவனத் தொடக்க அறிவிப்புகளை அனுப்புதல் ஆகிய இரண்டு பகுதிகளைக் கொண்ட ஒரு பணியை இந்த மாடல் வெற்றிகரமாக முடித்ததாக Zapier பொறியாளர்கள் குறிப்பிட்டுள்ளனர்; இதற்கு முன்பு முந்தைய மாடல்கள் இந்தப் பணியின் நடுப்பகுதியிலேயே தோல்வியடைந்தன.
செயல்திறன் அளவீடுகள்: முன்னணி மாடல்களுக்கு இணையாக
Sonnet 5 ஒரு நடுத்தர அளவிலான மாடலாக இருந்தாலும், அதன் செயல்திறன் அளவீடுகள் Anthropic-ன் முதன்மையான மாடலான Opus 4.8-க்கு நெருக்கமாக உள்ளன. ஏஜென்டிக் கோடிங் அளவீடுகளில் (agentic coding benchmarks), Sonnet 5 63.2% மதிப்பெண்களைப் பெற்றுள்ளது; இது அதன் முந்தைய பதிப்பான Sonnet 4.6 (58.1%)-ஐ விட கணிசமாக அதிகம் மற்றும் Opus 4.8 (69.2%)-க்கு மிகக் குறைவாகவே உள்ளது.
குறிப்பிடத்தக்க வகையில், குறிப்பிட்ட அறிவுசார் பணி அளவீடுகளில் (knowledge work benchmarks), Sonnet 5 உண்மையில் Opus 4.8-ஐ விடச் சிறப்பாகச் செயல்பட்டது. இது உயர்தர மாடல்களின் அதிகப்படியான விலையைச் செலுத்தாமல், ஆழமான தர்க்கரீதியான சிந்தனை தேவைப்படும் டெவலப்பர்களுக்கு ஒரு மிகச்சிறந்த தேர்வாக அமைகிறது. மிக உயர்ந்த துல்லியம் மற்றும் நுணுக்கமான முடிவெடுத்தலுக்கு Opus 4.8 தரநிலையாகத் தொடர்ந்தாலும், அன்றாடத் தானியங்கி பணிகளுக்குத் தரம் மற்றும் செலவு ஆகியவற்றின் சரியான சமநிலையை Sonnet 5 வழங்குகிறது என்று Anthropic கூறுகிறது.
ஆக்ரோஷமான விலை நிர்ணயம் மற்றும் பாதுகாப்புத் தரநிலைகள்
பயன்பாட்டை அதிகரிக்க, Anthropic ஒரு போட்டித்தன்மை வாய்ந்த விலை அமைப்பை அறிமுகப்படுத்தியுள்ளது. ஆகஸ்ட் 31 வரை, Sonnet 5-க்கான விலை ஒரு மில்லியன் இன்புட் டோக்கன்களுக்கு (input tokens) $2 மற்றும் ஒரு மில்லியன் அவுட்புட் டோக்கன்களுக்கு (output tokens) $10 என நிர்ணயிக்கப்பட்டுள்ளது. இந்த காலத்திற்குப் பிறகு, விலைகள் ஒரு மில்லியன் இன்புட் டோக்கன்களுக்கு $3 மற்றும் ஒரு மில்லியன் அவுட்புட் டோக்கன்களுக்கு $15 என மாற்றப்படும். இந்த விலை நிர்ணயம் Sonnet 5-ஐ OpenAI-ன் GPT-5.5 மற்றும் Google-ன் Gemini 3.1 Pro ஆகியவற்றை விட மலிவு விலையுள்ளதாக மாற்றுகிறது, இருப்பினும் இது Gemini 3.5 Flash-ஐ விட அதிக விலையானது.
ஏஜென்டிக் பயன்பாடுகளில் பாதுகாப்பு என்பது சமமான முக்கியத்துவம் வாய்ந்தது, அங்கு தீய கட்டளைகளை மறுக்கும் மாடலின் திறன் மிக அவசியமானது. Sonnet 4.6 உடன் ஒப்பிடுகையில், ஏமாற்றுதல் அல்லது தவறான பயன்பாட்டிற்கு ஒத்துழைத்தல் போன்ற "விரும்பத்தகாத நடத்தைகளின்" (undesirable behaviors) விகிதம் Sonnet 5-இல் குறைந்துள்ளது. மேலும், இது prompt-injection தாக்குதல்களுக்கு எதிராக மேம்பட்டத் திறனையும், மிகக் குறைந்த அளவிலான sycophantic behavior (பயனரின் விருப்பத்திற்கு இணங்கிப் பொய்யான பதில்களைத் தருதல்) பண்பையும் வெளிப்படுத்தியுள்ளது, இது மில்லியன் கணக்கான பயனர்களுக்குக் கருவிகளை வழங்கும் உருவாக்குநர்களுக்கு ஒரு நம்பகமான பங்காளியாக அமைகிறது.
முக்கியக் குறிப்புகள்
- ஏஜென்டிக் கவனம்: Sonnet 5 கருவிகளைப் பயன்படுத்துதல் (browsers/terminals) மற்றும் சுய-திருத்தம் (self-correction) உள்ளிட்ட தன்னாட்சிப் பணிகளுக்காக மேம்படுத்தப்பட்டுள்ளது, இது சிக்கலான தானியங்கி பணிகளுக்கு ஏற்றது.
- செலவுத் திறன்: இந்த மாடல் Opus 4.8, GPT-5.5 மற்றும் Gemini 3.1 Pro போன்ற முன்னணி மாடல்களுக்கு மாற்றாக, அதிக செயல்திறன் கொண்ட மற்றும் குறைந்த செலவிலான ஒரு சிறந்த தேர்வாகும்.
- மேம்படுத்தப்பட்ட பாதுகாப்பு: தீய கோரிக்கைகளை மறுப்பதிலும், prompt injections-களைத் தடுப்பதிலும் ஏற்பட்டுள்ள குறிப்பிடத்தக்க முன்னேற்றங்கள், ஏஜென்டிக் பணிப்பாய்வுகளுக்கு (agentic workflows) இதனைப் பாதுகாப்பானதாக மாற்றுகின்றன.
