Anthropic ਨੇ ਕਿਫਾਇਤੀ AI Agents ਨੂੰ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣਾਉਣ ਲਈ Claude Sonnet 5 ਲਾਂਚ ਕੀਤਾ
Anthropic ਨੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ Claude Sonnet 5 released ਕੀਤਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਮੱਧਮ-ਆਕਾਰ (midsize) ਮਾਡਲ ਹੈ। ਇਸ ਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਉੱਚ-ਪੱਧਰੀ ਤਰਕ (high-end reasoning) ਅਤੇ ਕਿਫਾਇਤੀ ਖੁਦਮੁਖਤਿਆਰ ਕਾਰਜਪ੍ਰਣਾਲੀ (cost-effective autonomous execution) ਵਿਚਕਾਰਲੇ ਪਾੜੇ ਨੂੰ ਪੂਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। "Agentic" ਸਮਰੱਥਾਵਾਂ—ਜਿਵੇਂ ਕਿ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਯੋਗਤਾ, ਯੋਜਨਾ ਬਣਾਉਣਾ ਅਤੇ ਵਾਰ-ਵਾਰ ਸੁਧਾਰ ਕਰਨਾ—ਨੂੰ ਤਰਜੀਹ ਦੇ ਕੇ, Anthropic Sonnet 5 ਨੂੰ ਆਟੋਮੇਟਡ ਵਰਕਫਲੋ ਬਣਾਉਣ ਵਾਲੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਮੁੱਖ ਇੰਜਣ ਵਜੋਂ ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ।
Agentic Intelligence ਵੱਲ ਤਬਦੀਲੀ
ਮੌਜੂਦਾ AI ਹਥਿਆਰਾਂ ਦੀ ਦੌੜ ਵਿੱਚ, ਉਦਯੋਗ ਸਧਾਰਨ ਚੈਟਬੋਟਾਂ ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ ਖੁਦਮੁਖਤਿਆਰ (autonomous) agents ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ। Anthropic ਦੀ ਇਹ ਰਿਲੀਜ਼ OpenAI ਦੇ GPT-5.6 Sol ਅਤੇ Google ਦੇ Gemini 3.5 Flash ਵਰਗੇ ਕਦਮਾਂ ਤੋਂ ਬਾਅਦ ਆਈ ਹੈ, ਜੋ ਇਹ ਸੰਕੇਤ ਦਿੰਦੀ ਹੈ ਕਿ agentic ਪ੍ਰਦਰਸ਼ਨ ਹੁਣ ਇੱਕ ਨਵਾਂ ਮਿਆਰ (baseline) ਬਣ ਗਿਆ ਹੈ।
Claude Sonnet 5 ਨੂੰ ਇੱਕ ਖੁਦਮੁਖਤਿਆਰ ਆਪਰੇਟਰ ਵਜੋਂ ਕੰਮ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਬਹੁ-ਪੜਾਅ ਵਾਲੇ ਕੰਮਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਬ੍ਰਾਊਜ਼ਰਾਂ ਅਤੇ ਟਰਮੀਨਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਯੋਗ ਹੈ। ਪਿਛਲੇ ਮਾਡਲਾਂ ਦੇ ਉਲਟ, ਜੋ ਕਿ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਦੌਰਾਨ ਰੁਕ ਸਕਦੇ ਸਨ, Sonnet 5 ਵਿੱਚ "ਆਪਣੇ ਆਪ ਦੇ ਆਉਟਪੁੱਟ ਦੀ ਜਾਂਚ ਕਰਨ" ਅਤੇ ਅੰਤ ਤੱਕ ਵਰਕਫਲੋ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦੀ ਇੱਕ ਵਿਲੱਖਣ ਯੋਗਤਾ ਹੈ। ਉਦਾਹਰਣ ਵਜੋਂ, Zapier ਦੇ ਇੰਜੀਨੀਅਰਾਂ ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ ਮਾਡਲ ਨੇ ਦੋ-ਭਾਗਾਂ ਵਾਲਾ ਕੰਮ ਸਫਲਤਾਪੂਰਵਕ ਪੂਰਾ ਕੀਤਾ—Salesforce ਅਕਾਊਂਟ ਟਾਇਰਾਂ ਨੂੰ ਅਪਡੇਟ ਕਰਨਾ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਲਾਂਚ ਐਨਾਂਸਮੈਂਟ ਭੇਜਣਾ—ਇੱਕ ਅਜਿਹੀ ਪ੍ਰਕਿਰਿਆ ਜਿਸ ਕਾਰਨ ਪਹਿਲਾਂ ਮਾਡਲ ਅੱਧ ਵਿਚਕਾਰ ਹੀ ਫੇਲ ਹੋ ਜਾਂਦੇ ਸਨ।
ਪ੍ਰਦਰਸ਼ਨ ਬੈਂਚਮਾਰਕ: ਵੱਡੇ ਖਿਡਾਰੀਆਂ ਦੇ ਬਰਾਬਰ
ਹਾਲਾਂਕਿ Sonnet 5 ਇੱਕ ਮੱਧਮ-ਆਕਾਰ ਦਾ ਮਾਡਲ ਹੈ, ਪਰ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਮਾਪਦੰਡ Anthropic ਦੇ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲ, Opus 4.8 ਦੇ ਨੇੜੇ ਹਨ। Agentic ਕੋਡਿੰਗ ਬੈਂਚਮਾਰਕਸ 'ਤੇ, Sonnet 5 ਨੇ 63.2% ਸਕੋਰ ਕੀਤਾ, ਜੋ ਕਿ ਇਸਦੇ ਪਿਛਲੇ ਮਾਡਲ Sonnet 4.6 (58.1%) ਨਾਲੋਂ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਹੈ, ਅਤੇ ਇਹ ਸਿਰਫ਼ Opus 4.8 (69.2%) ਤੋਂ ਥੋੜ੍ਹਾ ਪਿੱਛੇ ਹੈ।
ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ, ਖਾਸ ਗਿਆਨ-ਅਧਾਰਤ ਕੰਮਾਂ (knowledge work) ਦੇ ਬੈਂਚਮਾਰਕਸ ਵਿੱਚ, Sonnet 5 ਨੇ ਅਸਲ ਵਿੱਚ Opus 4.8 ਨੂੰ ਵੀ ਪਛਾੜ ਦਿੱਤਾ। ਇਹ ਉਹਨਾਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ਚੋਣ ਬਣਾਉਂਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਉੱਚ-ਪੱਧਰੀ ਮਾਡਲ ਦੀ ਮਹਿੰਗੀ ਕੀਮਤ ਤੋਂ ਬਿਨਾਂ ਡੂੰਘੇ ਤਰਕ ਦੀ ਲੋੜ ਹੈ। Anthropic ਦਾ ਸੁਝਾਅ ਹੈ ਕਿ ਜਿੱਥੇ Opus 4.8 ਬਹੁਤ ਜ਼ਿਆਦਾ ਸ਼ੁੱਧਤਾ ਅਤੇ ਬਾਰੀਕ ਫੈਸਲੇ ਲੈਣ ਲਈ ਮਿਆਰ ਬਣਿਆ ਹੋਇਆ ਹੈ, ਉੱਥੇ Sonnet 5 ਰੋਜ਼ਾਨਾ ਦੇ ਆਟੋਮੇਸ਼ਨ ਲਈ ਗੁਣਵੱਤਾ ਅਤੇ ਲਾਗਤ ਦਾ ਆਦਰਸ਼ ਸੰਤੁਲਨ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
ਆਕਰਸ਼ਕ ਕੀਮਤਾਂ ਅਤੇ ਸੁਰੱਖਿਆ ਮਿਆਰ
ਇਸ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਵਰਤਣ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ, Anthropic ਨੇ ਇੱਕ ਮੁਕਾਬਲੇਬਾਜ਼ ਕੀਮਤ ਢਾਂਚਾ ਪੇਸ਼ ਕੀਤਾ ਹੈ। 31 ਅਗਸਤ ਤੱਕ, Sonnet 5 ਦੀ ਕੀਮਤ $2 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਇਨਪੁੱਟ ਟੋਕਨ ਅਤੇ $10 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ ਹੈ। ਇਸ ਮਿਆਦ ਤੋਂ ਬਾਅਦ, ਕੀਮਤਾਂ $3 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਇਨਪੁੱਟ ਟੋਕਨ ਅਤੇ $15 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ ਹੋ ਜਾਣਗੀਆਂ। ਇਹ ਸਥਿਤੀ Sonnet 5 ਨੂੰ OpenAI ਦੇ GPT-5.5 ਅਤੇ Google ਦੇ Gemini 3.1 Pro ਨਾਲੋਂ ਵਧੇਰੇ ਕਿਫਾਇਤੀ ਬਣਾਉਂਦੀ ਹੈ, ਹਾਲਾਂਕਿ ਇਹ Gemini 3.5 Flash ਨਾਲੋਂ ਮਹਿੰਗਾ ਰਹਿੰਦਾ ਹੈ।
Agentic ਤੈਨਾਤੀਆਂ (deployments) ਵਿੱਚ ਸੁਰੱਖਿਆ ਵੀ equally ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿੱਥੇ ਮਾਡਲ ਦੀ ਦੁਸ਼ਮਣਾਨਾ ਭਰਪੂਰ (malicious) ਹੁਕਮਾਂ ਨੂੰ ਰੱਦ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਭ ਤੋਂ ਉੱਪਰ ਹੈ। Sonnet 4.6 ਦੇ ਮੁਕਾਬਲੇ, Sonnet 5 ਵਿੱਚ "ਅਣਚਾਹੇ ਵਿਵਹਾਰਾਂ" ਦੀ ਦਰ ਘੱਟ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਧੋਖਾਧੜੀ ਜਾਂ ਦੁਰਵਰਤੋਂ ਵਿੱਚ ਸਹਿਯੋਗ ਕਰਨਾ। ਇਸ ਨੇ prompt-injection ਹਮਲਿਆਂ ਵਿਰੁੱਧ ਬਿਹਤਰ ਲਚਕਤਾ ਅਤੇ sycophantic ਵਿਵਹਾਰ ਦੀ ਘੱਟ ਦਰ ਵੀ ਦਿਖਾਈ ਹੈ, ਜੋ ਇਸਨੂੰ ਲੱਖਾਂ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਟੂਲਸ ਤੈਨਾਤ ਕਰਨ ਵਾਲੇ ਬਿਲਡਰਾਂ ਲਈ ਇੱਕ ਵਧੇਰੇ ਭਰੋਸੇਮੰਦ ਸਾਥੀ ਬਣਾਉਂਦਾ ਹੈ।
ਮੁੱਖ ਗੱਲਾਂ
- Agentic Focus: Sonnet 5 ਨੂੰ ਖੁਦਮੁਖਤਿਆਰ ਕੰਮਾਂ ਲਈ ਆਪਟੀਮਾਈਜ਼ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਟੂਲ ਦੀ ਵਰਤੋਂ (browsers/terminals) ਅਤੇ ਸਵੈ-ਸੁਧਾਰ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਇਸਨੂੰ ਗੁੰਝਲਦਾਰ ਆਟੋਮੇਸ਼ਨ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ।
- Cost-Efficiency: ਇਹ ਮਾਡਲ Opus 4.8, GPT-5.5, ਅਤੇ Gemini 3.1 Pro ਵਰਗੇ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲਾਂ ਦਾ ਇੱਕ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲਾ, ਘੱਟ-ਲਾਗਤ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
- Enhanced Safety: ਦੁਸ਼ਮਣਾਨਾ ਭਰਪੂਰ ਬੇਨਤੀਆਂ ਨੂੰ ਰੱਦ ਕਰਨ ਅਤੇ prompt injections ਦਾ ਵਿਰੋਧ ਕਰਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਇਸਨੂੰ agentic ਵਰਕਫਲੋ ਲਈ ਵਧੇਰੇ ਸੁਰੱਖਿਅਤ ਬਣਾਉਂਦੇ ਹਨ।
