OpenAI ਨੇ Jalapeño ਦਾ अनाਹਰ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI ਇਨਫਰੈਂਸ ਚਿੱਪ

OpenAI ਨੇ Broadcom ਦੇ ਸਹਿਯੋਗ ਨਾਲ ਵਿਕਸਤ ਕੀਤੇ ਆਪਣੇ ਪਹਿਲੇ ਕਸਟਮ-ਬਣਾਏ ਇਨਫਰੈਂਸ ਪ੍ਰੋਸੈਸਰ, Jalapeño ਦੀ ਘੋਸ਼ਣਾ ਕਰਕੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸਿਲੀਕਾਨ ਦੀ ਦੌੜ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਗਿਆ ਹੈ। ਇਹ ਰਣਨੀਤਕ ਕਦਮ OpenAI ਦੀ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੀ ਰਣਨੀਤੀ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਬਦੀਲੀ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਇਸਦੇ ਵਿਸ਼ਾਲ ਮਾਡਲਾਂ ਨੂੰ ਉਪਭੋਗਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚਾਉਣ ਦੇ ਤਰੀਕੇ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਹੈ।

Nvidia GPUs 'ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਖਤਮ ਕਰਨਾ

ਸਾਲਾਂ ਤੋਂ, AI ਉਦਯੋਗ Nvidia ਦੇ ਉੱਚ-ਐਂਡ GPUs 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਰਿਹਾ ਹੈ। ਹਾਲਾਂਕਿ, OpenAI ਆਪਣੇ ਖੁਦ ਦੇ "AI accelerators" — ਵਿਸ਼ੇਸ਼ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਰਕਲੋਡਾਂ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਵਿਸ਼ੇਸ਼ ਸਿਲੀਕਾਨ — ਵਿਕਸਤ ਕਰਕੇ Google ਅਤੇ Amazon ਵਰਗੇ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੀ ਕਤਾਰ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਰਿਹਾ ਹੈ। ਜਦੋਂ ਕਿ Nvidia ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਲਈ ਲੋੜੀਂਦੀ ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪਾਵਰ ਲਈ ਸੁਨਹਿਰੀ ਮਿਆਰ ਬਣਿਆ ਹੋਇਆ ਹੈ, OpenAI ਅਗਲੇ ਮਹੱਤਵਪੂਰਨ ਰੁਕਾਵਟ (bottleneck) ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾ ਰਿਹਾ ਹੈ: ਇਨਫਰੈਂਸ (inference)।

Jalapeño ਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਇਨਫਰੈਂਸ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਉਹ ਪੜਾਅ ਹੈ ਜਿੱਥੇ ਇੱਕ ਪ੍ਰੀ-ਟ੍ਰੇਨਡ ਮਾਡਲ ਆਉਟਪੁੱਟ ਜਨਰੇਟ ਕਰਨ ਲਈ ਉਪਭੋਗਤਾ ਦੇ ਕਮਾਂਡਾਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ। ਇਸ ਖਾਸ ਪੜਾਅ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਕੇ, OpenAI ਦਾ ਉਦੇਸ਼ ਜਨਰਲ-ਪਰਪਜ਼ ਹਾਰਡਵੇਅਰ 'ਤੇ ਆਪਣੀ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣਾ ਅਤੇ ਆਪਣੀਆਂ ਸੰਚਾਲਨ ਲਾਗਤਾਂ (operational costs) 'ਤੇ ਬਾਰੀਕ ਕੰਟਰੋਲ ਪ੍ਰਾਪਤ ਕਰਨਾ ਹੈ।

Performance-per-Watt ਅਤੇ ਆਰਥਿਕ ਕੁਸ਼ਲਤਾ

Jalapeño ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਦਾਅਵਿਆਂ ਵਿੱਚੋਂ ਇੱਕ ਇਸਦੀ ਕੁਸ਼ਲਤਾ ਹੈ। OpenAI ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ ਕਿ ਸ਼ੁਰੂਆਤੀ ਟੈਸਟਿੰਗ ਦਿਖਾਉਂਦੀ ਹੈ ਕਿ ਇਹ ਚਿੱਪ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਵਿਕਲਪਾਂ ਦੇ ਮੁਕਾਬਲੇ ਕਾਫ਼ੀ ਬਿਹਤਰ performance-per-watt ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। ਹਾਈਪਰ-ਸਕੇਲ AI ਦੀ ਦੁਨੀਆ ਵਿੱਚ, ਪਾਵਰ ਕੁਸ਼ਲਤਾ ਸਿਰਫ਼ ਇੱਕ ਤਕਨੀਕੀ ਮਾਪਦੰਡ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਮੁੱਖ ਆਰਥਿਕ ਡਰਾਈਵਰ ਹੈ।

ਕੰਪਨੀ ਨੇ ਖਾਸ ਤੌਰ 'ਤੇ ਰੀਅਲ-ਟਾਈਮ ਕੋਡਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਵੇਲੇ ਸੰਚਾਲਨ ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਦੀ ਚਿੱਪ ਦੀ ਯੋਗਤਾ 'ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ OpenAI ਆਪਣੇ agentic ਉਤਪਾਦਾਂ, ਜਿਵੇਂ ਕਿ Codex, ਦਾ ਵਿਸਤਾਰ ਕਰ ਰਿਹਾ ਹੈ, ਪ੍ਰਤੀ ਟੋਕਨ ਘੱਟ ਲਾਗਤ 'ਤੇ ਗੁੰਝਲਦਾਰ ਤਰਕ (reasoning) ਕਾਰਜਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਯੋਗਤਾ ਸਿਹਤਮੰਦ ਮਾਰਜਿਨ ਬਣਾਈ ਰੱਖਣ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਉਪਭੋਗਤਾਵਾਂ ਦੋਵਾਂ ਲਈ AI ਨੂੰ ਵਧੇਰੇ ਕਿਫਾਇਤੀ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇਗੀ।

ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ: ਪੂਰੇ AI ਸਟੈਕ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ

Jalapeño ਦਾ ਵਿਕਾਸ ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਲਈ OpenAI ਦੀ ਵਚਨਬੱਧਤਾ ਦਾ ਪ੍ਰਮਾਣ ਹੈ। ਕੰਪਨੀ ਹੁਣ ਸਿਰਫ਼ ਇੱਕ ਮਾਡਲ ਬਣਾਉਣ ਵਾਲੀ ਨਹੀਂ ਰਹੀ; ਇਹ ਇੱਕ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪ੍ਰਦਾਤਾ ਬਣ ਰਹੀ ਹੈ। OpenAI ਦੀ ਰਣਨੀਤੀ ਵਿੱਚ ਟੈਕਨੋਲੋਜੀ ਸਟੈਕ ਦੀ ਹਰ ਪਰਤ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਸ਼ਾਮਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਚਿੱਪ ਆਰਕੀਟੈਕਚਰ, kernels, ਮੈਮੋਰੀ ਸਿਸਟਮ, ਨੈੱਟਵਰਕਿੰਗ, ਅਤੇ ਡਿਪਲੋਇਮੈਂਟ ਸ਼ਡਿਊਲਿੰਗ ਸ਼ਾਮਲ ਹਨ।

ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ OpenAI ਨੇ Jalapeño ਚਿੱਪ ਦੇ ਡਿਜ਼ਾਈਨ ਅਤੇ ਵਿਕਾਸ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਆਪਣੇ ਖੁਦ ਦੇ AI ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਹ ਫੀਡਬੈਕ ਲੂਪ—ਜਿੱਥੇ AI ਉਸ ਹਾਰਡਵੇਅਰ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰਦਾ ਹੈ ਜੋ ਅੰਤ ਵਿੱਚ AI ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਨੂੰ ਚਲਾਏਗਾ—ਹਾਰਡਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਵਿੱਚ ਇੱਕ ਉੱਨਤ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਹਾਰਡਵੇਅਰ ਨੂੰ ਕੰਟਰੋਲ ਕਰਕੇ, OpenAI ਇਹ ਯਕੀਨੀ ਬਣਾ ਸਕਦਾ ਹੈ ਕਿ ਇਸਦਾ ਸਾਫਟਵੇਅਰ ਅਤੇ ਸਿਲੀਕਾਨ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਿੰਕ੍ਰੋਨਾਈਜ਼ਡ ਹਨ, ਜਿਸ ਨਾਲ ਤੇਜ਼ ਅਤੇ ਵਧੇਰੇ ਭਰੋਸੇਯੋਗ ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਮਿਲਦਾ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ

  • ਟਾਰਗੇਟਡ ਇਨਫਰੈਂਸ (Targeted Inference): Jalapeño ਇੱਕ ਕਸਟਮ ਇਨਫਰੈਂਸ ਪ੍ਰੋਸੈਸਰ ਹੈ ਜੋ ਸ਼ੁਰੂਆਤੀ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਦੀ ਬਜਾਏ ਮਾਡਲਾਂ ਦੀ ਤੈਨਾਤੀ (deployment) ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ OpenAI ਅਤੇ Broadcom ਦੁਆਰਾ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ।
  • ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਵਾਧਾ: ਸ਼ੁਰੂਆਤੀ ਨਤੀਜੇ ਬਿਹਤਰ performance-per-watt ਦਾ ਸੰਕੇਤ ਦਿੰਦੇ ਹਨ, ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਕੋਡਿੰਗ ਮਾਡਲਾਂ ਵਰਗੀਆਂ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਘੱਟ ਸੰਚਾਲਨ ਲਾਗਤਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੇ ਹਨ।
  • ਫੁੱਲ-ਸਟੈਕ ਰਣਨੀਤੀ: OpenAI ਪੂਰੀ ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਚਿੱਪ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਮੈਮੋਰੀ ਸਿਸਟਮ ਤੋਂ ਲੈ ਕੇ ਉਹਨਾਂ 'ਤੇ ਚੱਲਣ ਵਾਲੇ agentic ਉਤਪਾਦਾਂ ਤੱਕ ਸਭ ਕੁਝ ਡਿਜ਼ਾਈਨ ਕਰ ਰਿਹਾ ਹੈ।