Claude Sonnet 5: ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਕੀਮਤ ਵਿੱਚ ਵੱਡੀ ਵਾਧੇ ਨੂੰ ਛੁਪਾ ਰਿਹਾ ਹੈ

Anthropic ਦਾ ਤਾਜ਼ਾ ਰਿਲੀਜ਼, Claude Sonnet 5, ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਬੈਂਚਮਾਰਕ ਲਾਭ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਪਰ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਲੁਕਿਆ ਹੋਇਆ ਵਿੱਤੀ ਬੋਝ ਵੀ ਲਿਆਉਂਦਾ ਹੈ। ਹਾਲਾਂਕਿ ਅਧਿਕਾਰਤ ਟੋਕਨ ਦਰਾਂ ਬਦਲੀਆਂ ਨਹੀਂ ਹਨ, ਨਵਾਂ ਡੇਟਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਦੀ ਵਧੇ ਹੋਈ ਵਾਧੂ ਜਾਣਕਾਰੀ (verbosity) ਅਤੇ ਏਜੈਂਟਿਕ ਵਿਵਹਾਰ (agentic behavior) ਪ੍ਰਤੀ ਟਾਸਕ ਅਸਲ ਲਾਗਤ ਨੂੰ ਕਾਫ਼ੀ ਵਧਾ ਦਿੰਦੇ ਹਨ।

ਬੁੱਧੀਮਾਨਤਾ ਵਿੱਚ ਵਾਧਾ ਬਨਾਮ ਟੋਕਨ ਦੀ ਖਪਤ

Artificial Analysis Intelligence Index v4.1 ਦੇ ਅਨੁਸਾਰ, Claude Sonnet 5 ਨੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਮੀਲ ਪੱਥਰ ਹਾਸਲ ਕੀਤਾ ਹੈ। 53 ਅੰਕ ਪ੍ਰਾਪਤ ਕਰਕੇ, ਇਹ ਵਿਸ਼ਵ ਪੱਧਰ 'ਤੇ ਪੰਜਵੇਂ ਸਥਾਨ 'ਤੇ ਹੈ, ਜੋ GPT-5.5 (high) ਦੇ ਬਰਾਬਰ ਹੈ ਅਤੇ ਆਪਣੇ ਪਿਛਲੇ ਮਾਡਲ, Sonnet 4.6 (ਜਿਸ ਨੇ 47 ਅੰਕ ਪ੍ਰਾਪਤ ਕੀਤੇ ਸਨ) ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਉਛਾਲ ਕਈ ਵਿਸ਼ੇਸ਼ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਸਪਸ਼ਟ ਹੈ, ਜਿਸ ਵਿੱਚ Terminal-Bench v2.1 'ਤੇ 9 ਅੰਕਾਂ ਦਾ ਉਛਾਲ ਅਤੇ Humanity's Last Exam 'ਤੇ 10 ਅੰਕਾਂ ਦਾ ਵਾਧਾ ਸ਼ਾਮਲ ਹੈ।

ਹਾਲਾਂਕਿ, ਬੁੱਧੀਮਾਨਤਾ ਵਿੱਚ ਇਹ ਵਾਧਾ ਟੋਕਨ ਦੀ ਅਤਿ ਜ਼ਿਆਦਾ ਖਪਤ ਦੀ ਕੀਮਤ 'ਤੇ ਆਉਂਦਾ ਹੈ। AA-Briefcase ਅਤੇ GDPval-AA ਵਰਗੇ ਏਜੈਂਟ-ਅਧਾਰਤ ਗਿਆਨ ਕਾਰਜ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ, Sonnet 5 ਲਗਭਗ Sonnet 4.6 ਦੇ ਮੁਕਾਬਲੇ ਤਿੰਨ ਗੁਣਾ ਜ਼ਿਆਦਾ ਏਜੈਂਟ ਲੂਪਸ (agent loops) ਚਲਾਉਂਦਾ ਹੈ। ਵੱਧ ਤੋਂ ਵੱਧ ਪ੍ਰਦਰਸ਼ਨ ਸੈਟਿੰਗਾਂ 'ਤੇ, ਇਹ ਮਾਡਲ ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਤੀ ਟਾਸਕ ਲਗਭਗ 40% ਵਧੇਰੇ ਆਊਟਪੁੱਟ ਟੋਕਨਾਂ ਦੀ ਖਪਤ ਕਰਦਾ ਹੈ।

ਸਥਿਰ ਟੋਕਨ ਕੀਮਤਾਂ ਦਾ ਭਰਮ

ਉਪਰਲੇ ਪੱਧਰ 'ਤੇ, Anthropic ਨੇ ਆਪਣੀ ਕੀਮਤ ਬਣਾਈ ਰੱਖੀ ਹੈ: $3 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਇਨਪੁੱਟ ਟੋਕਨ ਅਤੇ $15 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਆਊਟਪੁੱਟ ਟੋਕਨ। ਇਹ Opus 4.8 ਟਾਇਰ ਨਾਲੋਂ ਕਾਫ਼ੀ ਸਸਤਾ ਹੈ, ਜਿਸਦੀ ਕੀਮਤ ਕ੍ਰਮਵਾਰ $5 ਅਤੇ $25 ਹੈ। ਫਿਰ ਵੀ, "ਪ੍ਰਤੀ ਟਾਸਕ ਲਾਗਤ" ਇੱਕ ਵੱਖਰੀ ਕਹਾਣੀ ਦੱਸਦੀ ਹੈ।

Artificial Analysis ਦੀ ਰਿਪੋਰਟ ਅਨੁਸਾਰ, Intelligence Index ਵਿੱਚ ਇੱਕ ਔਸਤ ਟਾਸਕ ਦੀ ਲਾਗਤ Sonnet 5 ਨਾਲ $2.29 ਹੈ, ਜਦੋਂ ਕਿ ਵਧੇਰੇ ਮਹਿੰਗਾ Opus 4.8 ਸਿਰਫ $1.97 ਦਾ ਪੈਂਦਾ ਹੈ। Sonnet 4.6 ਤੋਂ Sonnet 5 'ਤੇ ਜਾਣ ਵਾਲੇ ਡਿਵੈਲਪਰਾਂ ਲਈ—ਜਿਸਦੀ ਲਾਗਤ ਲਗਭਗ $1.20 ਪ੍ਰਤੀ ਟਾਸਕ ਸੀ—Sonnet 5 'ਤੇ ਜਾਣਾ ਕਾਰਜਸ਼ੀਲ ਖਰਚਿਆਂ ਵਿੱਚ ਲਗਭਗ ਦੁੱਗਣੀ ਵਾਧਾ ਹੈ। ਇਹ ਪੈਟਰਨ ਪਿਛਲੇ ਰਿਲੀਜ਼ਾਂ, ਜਿਵੇਂ ਕਿ Opus 4.7 ਦੀ ਯਾਦ ਦਿਵਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ "ਬਦਲੀਆਂ ਨਾ ਹੋਣ" ਵਾਲੀਆਂ ਦਰਾਂ ਦੇ ਬਾਵਜੂਦ ਟੋਕਨਾਈਜ਼ਰ ਵਿੱਚ ਬਦਲਾਅ ਕਾਰਨ ਲਾਗਤ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਰੂਪ ਵਿੱਚ 37.4% ਤੱਕ ਵਧ ਗਈ ਸੀ।

ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦਾ ਦਬਾਅ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਲੋੜ

ਹਾਲਾਂਕਿ Sonnet 5 ਕੁਝ ਏਜੈਂਟਿਕ ਟਾਸਕਾਂ ਵਿੱਚ ਵਧੀਆ ਹੈ, ਪਰ ਇਹ ਅਜੇ ਵੀ ਉੱਚ-ਪੱਧਰੀ ਭੌਤਿਕ ਵਿਗਿਆਨ (physics) ਤਰਕ ਵਿੱਚ ਸੰਘਰਸ਼ ਕਰ ਰਿਹਾ ਹੈ। Argonne National Labs ਦੇ CritPt ਬੈਂਚਮਾਰਕ 'ਤੇ, ਇਸ ਨੇ 17% ਅੰਕ ਪ੍ਰਾਪਤ ਕੀਤੇ, ਜੋ GLM-5.2, Claude Fable 5, ਅਤੇ GPT-5.5 ਵਰਗੇ ਭਾਰੀ ਖਿਡਾਰੀਆਂ ਤੋਂ ਪਿੱਛੇ ਹੈ।

ਇਹ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਪਾੜਾ ਅਤੇ ਵਧਦੀ ਲਾਗਤ ਬਣਤਰ Anthropic ਨੂੰ ਇੱਕ ਅਸਥਿਰ ਸਥਿਤੀ ਵਿੱਚ ਰੱਖਦੀ ਹੈ। ਕਿਉਂਕਿ Deepseek V4 Pro ਅਤੇ GLM-5.2 ਵਰਗੇ ਚੀਨੀ ਮੁਕਾਬਲੇਬਾਜ਼ ਬਹੁਤ ਘੱਟ ਕੀਮਤ 'ਤੇ ਤੁਲਨਾਤਮਕ ਮੱਧ-ਦਰਜੇ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, Claude ਪਰਿਵਾਰ ਦੀ "ਲੁਕੀ ਹੋਈ" ਕੀਮਤ ਵਿੱਚ ਵਾਧਾ ਉਦਯੋਗਿਕ ਅਪਣਾਉਣ (enterprise adoption) ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਾਰਕ ਬਣ ਜਾਂਦਾ ਹੈ। ਉਦਯੋਗ ਹੁਣ ਸਿਰਫ਼ ਕੱਚੇ ਟੋਕਨਾਂ ਦੀ ਗਿਣਤੀ 'ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ ਵਧੇਰੇ ਪਾਰਦਰਸ਼ੀ ਮਾਪਦੰਡਾਂ—ਜਿਵੇਂ ਕਿ ਮਿਆਰੀ ਟਾਸਕ ਦੀ ਲਾਗਤ—ਦੀ ਲੋੜ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਕਿਉਂਕਿ ਟੋਕਨਾਂ ਦੀ ਗਿਣਤੀ ਹੁਣ ਏਜੈਂਟਿਕ ਵਰਕਫਲੋ ਦੇ ਅਸਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲੋਡ ਨੂੰ ਨਹੀਂ ਦਰਸਾਉਂਦੀ।

ਮੁੱਖ ਨੁਕਤੇ

  • ਲੁਕੀ ਹੋਈ ਲਾਗਤ ਵਿੱਚ ਵਾਧਾ: ਇੱਕੋ ਜਿਹੀਆਂ ਟੋਕਨ ਦਰਾਂ ਦੇ ਬਾਵਜੂਦ, ਵਧੇ ਹੋਏ ਟੋਕਨ ਦੀ ਖਪਤ ਕਾਰਨ Sonnet 5, Sonnet 4.6 ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਤੀ ਟਾਸਕ ਲਗਭਗ 90% ਵਧੇਰੇ ਮਹਿੰਗਾ ਹੈ।
  • ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਰਸ਼ਨ: Sonnet 5 53 ਅੰਕਾਂ ਨਾਲ ਵਿਸ਼ਵ ਪੱਧਰ 'ਤੇ 5ਵੇਂ ਸਥਾਨ 'ਤੇ ਹੈ, ਜੋ ਏਜੈਂਟਿਕ ਲੂਪਸ ਅਤੇ SciCode ਅਤੇ Terminal-Bench ਵਰਗੇ ਵਿਸ਼ੇਸ਼ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਵੱਡਾ ਵਾਧਾ ਦਿਖਾਉਂਦਾ ਹੈ।
  • ਕੀਮਤ ਵਿੱਚ ਅਸਮਾਨਤਾ: ਅਸਲ ਦੁਨੀਆ ਦੇ ਬੁੱਧੀਮਾਨਤਾ ਬੈਂਚਮਾਰਕਾਂ ਦੁਆਰਾ ਮਾਪੇ ਜਾਣ 'ਤੇ, "ਸਸਤਾ" Sonnet 5 ਅਸਲ ਵਿੱਚ ਪ੍ਰੀਮੀਅਮ Opus 4.8 ($1.97) ਨਾਲੋਂ ਪ੍ਰਤੀ ਟਾਸਕ ਵਧੇਰੇ ($2.29) ਖਰਚਾ ਕਰਦਾ ਹੈ।