OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

Translated for your language. Read the original.

AI-assisted draft.

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

In this article

OpenAI ਨੇ Jalapeño ਦਾ अनाਹਰ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI ਇਨਫਰੈਂਸ ਚਿੱਪ

OpenAI ਨੇ Broadcom ਦੇ ਸਹਿਯੋਗ ਨਾਲ ਵਿਕਸਤ ਕੀਤੇ ਆਪਣੇ ਪਹਿਲੇ ਕਸਟਮ-ਬਣਾਏ ਇਨਫਰੈਂਸ ਪ੍ਰੋਸੈਸਰ, Jalapeño ਦੀ ਘੋਸ਼ਣਾ ਕਰਕੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸਿਲੀਕਾਨ ਦੀ ਦੌੜ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਗਿਆ ਹੈ। ਇਹ ਰਣਨੀਤਕ ਕਦਮ OpenAI ਦੀ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੀ ਰਣਨੀਤੀ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਬਦੀਲੀ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਇਸਦੇ ਵਿਸ਼ਾਲ ਮਾਡਲਾਂ ਨੂੰ ਉਪਭੋਗਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚਾਉਣ ਦੇ ਤਰੀਕੇ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਹੈ।

Nvidia GPUs 'ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਖਤਮ ਕਰਨਾ

ਸਾਲਾਂ ਤੋਂ, AI ਉਦਯੋਗ Nvidia ਦੇ ਉੱਚ-ਐਂਡ GPUs 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਰਿਹਾ ਹੈ। ਹਾਲਾਂਕਿ, OpenAI ਆਪਣੇ ਖੁਦ ਦੇ "AI accelerators" — ਵਿਸ਼ੇਸ਼ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਰਕਲੋਡਾਂ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਵਿਸ਼ੇਸ਼ ਸਿਲੀਕਾਨ — ਵਿਕਸਤ ਕਰਕੇ Google ਅਤੇ Amazon ਵਰਗੇ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੀ ਕਤਾਰ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਰਿਹਾ ਹੈ। ਜਦੋਂ ਕਿ Nvidia ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਲਈ ਲੋੜੀਂਦੀ ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪਾਵਰ ਲਈ ਸੁਨਹਿਰੀ ਮਿਆਰ ਬਣਿਆ ਹੋਇਆ ਹੈ, OpenAI ਅਗਲੇ ਮਹੱਤਵਪੂਰਨ ਰੁਕਾਵਟ (bottleneck) ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾ ਰਿਹਾ ਹੈ: ਇਨਫਰੈਂਸ (inference)।

Jalapeño ਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਇਨਫਰੈਂਸ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਉਹ ਪੜਾਅ ਹੈ ਜਿੱਥੇ ਇੱਕ ਪ੍ਰੀ-ਟ੍ਰੇਨਡ ਮਾਡਲ ਆਉਟਪੁੱਟ ਜਨਰੇਟ ਕਰਨ ਲਈ ਉਪਭੋਗਤਾ ਦੇ ਕਮਾਂਡਾਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ। ਇਸ ਖਾਸ ਪੜਾਅ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਕੇ, OpenAI ਦਾ ਉਦੇਸ਼ ਜਨਰਲ-ਪਰਪਜ਼ ਹਾਰਡਵੇਅਰ 'ਤੇ ਆਪਣੀ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣਾ ਅਤੇ ਆਪਣੀਆਂ ਸੰਚਾਲਨ ਲਾਗਤਾਂ (operational costs) 'ਤੇ ਬਾਰੀਕ ਕੰਟਰੋਲ ਪ੍ਰਾਪਤ ਕਰਨਾ ਹੈ।

Performance-per-Watt ਅਤੇ ਆਰਥਿਕ ਕੁਸ਼ਲਤਾ

Jalapeño ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਦਾਅਵਿਆਂ ਵਿੱਚੋਂ ਇੱਕ ਇਸਦੀ ਕੁਸ਼ਲਤਾ ਹੈ। OpenAI ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ ਕਿ ਸ਼ੁਰੂਆਤੀ ਟੈਸਟਿੰਗ ਦਿਖਾਉਂਦੀ ਹੈ ਕਿ ਇਹ ਚਿੱਪ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਵਿਕਲਪਾਂ ਦੇ ਮੁਕਾਬਲੇ ਕਾਫ਼ੀ ਬਿਹਤਰ performance-per-watt ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। ਹਾਈਪਰ-ਸਕੇਲ AI ਦੀ ਦੁਨੀਆ ਵਿੱਚ, ਪਾਵਰ ਕੁਸ਼ਲਤਾ ਸਿਰਫ਼ ਇੱਕ ਤਕਨੀਕੀ ਮਾਪਦੰਡ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਮੁੱਖ ਆਰਥਿਕ ਡਰਾਈਵਰ ਹੈ।

ਕੰਪਨੀ ਨੇ ਖਾਸ ਤੌਰ 'ਤੇ ਰੀਅਲ-ਟਾਈਮ ਕੋਡਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਵੇਲੇ ਸੰਚਾਲਨ ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਦੀ ਚਿੱਪ ਦੀ ਯੋਗਤਾ 'ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ OpenAI ਆਪਣੇ agentic ਉਤਪਾਦਾਂ, ਜਿਵੇਂ ਕਿ Codex, ਦਾ ਵਿਸਤਾਰ ਕਰ ਰਿਹਾ ਹੈ, ਪ੍ਰਤੀ ਟੋਕਨ ਘੱਟ ਲਾਗਤ 'ਤੇ ਗੁੰਝਲਦਾਰ ਤਰਕ (reasoning) ਕਾਰਜਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਯੋਗਤਾ ਸਿਹਤਮੰਦ ਮਾਰਜਿਨ ਬਣਾਈ ਰੱਖਣ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਉਪਭੋਗਤਾਵਾਂ ਦੋਵਾਂ ਲਈ AI ਨੂੰ ਵਧੇਰੇ ਕਿਫਾਇਤੀ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇਗੀ।

ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ: ਪੂਰੇ AI ਸਟੈਕ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ

Jalapeño ਦਾ ਵਿਕਾਸ ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਲਈ OpenAI ਦੀ ਵਚਨਬੱਧਤਾ ਦਾ ਪ੍ਰਮਾਣ ਹੈ। ਕੰਪਨੀ ਹੁਣ ਸਿਰਫ਼ ਇੱਕ ਮਾਡਲ ਬਣਾਉਣ ਵਾਲੀ ਨਹੀਂ ਰਹੀ; ਇਹ ਇੱਕ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪ੍ਰਦਾਤਾ ਬਣ ਰਹੀ ਹੈ। OpenAI ਦੀ ਰਣਨੀਤੀ ਵਿੱਚ ਟੈਕਨੋਲੋਜੀ ਸਟੈਕ ਦੀ ਹਰ ਪਰਤ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਸ਼ਾਮਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਚਿੱਪ ਆਰਕੀਟੈਕਚਰ, kernels, ਮੈਮੋਰੀ ਸਿਸਟਮ, ਨੈੱਟਵਰਕਿੰਗ, ਅਤੇ ਡਿਪਲੋਇਮੈਂਟ ਸ਼ਡਿਊਲਿੰਗ ਸ਼ਾਮਲ ਹਨ।

ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ OpenAI ਨੇ Jalapeño ਚਿੱਪ ਦੇ ਡਿਜ਼ਾਈਨ ਅਤੇ ਵਿਕਾਸ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਆਪਣੇ ਖੁਦ ਦੇ AI ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਹ ਫੀਡਬੈਕ ਲੂਪ—ਜਿੱਥੇ AI ਉਸ ਹਾਰਡਵੇਅਰ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰਦਾ ਹੈ ਜੋ ਅੰਤ ਵਿੱਚ AI ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਨੂੰ ਚਲਾਏਗਾ—ਹਾਰਡਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਵਿੱਚ ਇੱਕ ਉੱਨਤ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਹਾਰਡਵੇਅਰ ਨੂੰ ਕੰਟਰੋਲ ਕਰਕੇ, OpenAI ਇਹ ਯਕੀਨੀ ਬਣਾ ਸਕਦਾ ਹੈ ਕਿ ਇਸਦਾ ਸਾਫਟਵੇਅਰ ਅਤੇ ਸਿਲੀਕਾਨ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਿੰਕ੍ਰੋਨਾਈਜ਼ਡ ਹਨ, ਜਿਸ ਨਾਲ ਤੇਜ਼ ਅਤੇ ਵਧੇਰੇ ਭਰੋਸੇਯੋਗ ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਮਿਲਦਾ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ

ਟਾਰਗੇਟਡ ਇਨਫਰੈਂਸ (Targeted Inference): Jalapeño ਇੱਕ ਕਸਟਮ ਇਨਫਰੈਂਸ ਪ੍ਰੋਸੈਸਰ ਹੈ ਜੋ ਸ਼ੁਰੂਆਤੀ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਦੀ ਬਜਾਏ ਮਾਡਲਾਂ ਦੀ ਤੈਨਾਤੀ (deployment) ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ OpenAI ਅਤੇ Broadcom ਦੁਆਰਾ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ।
ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਵਾਧਾ: ਸ਼ੁਰੂਆਤੀ ਨਤੀਜੇ ਬਿਹਤਰ performance-per-watt ਦਾ ਸੰਕੇਤ ਦਿੰਦੇ ਹਨ, ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਕੋਡਿੰਗ ਮਾਡਲਾਂ ਵਰਗੀਆਂ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਘੱਟ ਸੰਚਾਲਨ ਲਾਗਤਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੇ ਹਨ।
ਫੁੱਲ-ਸਟੈਕ ਰਣਨੀਤੀ: OpenAI ਪੂਰੀ ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਚਿੱਪ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਮੈਮੋਰੀ ਸਿਸਟਮ ਤੋਂ ਲੈ ਕੇ ਉਹਨਾਂ 'ਤੇ ਚੱਲਣ ਵਾਲੇ agentic ਉਤਪਾਦਾਂ ਤੱਕ ਸਭ ਕੁਝ ਡਿਜ਼ਾਈਨ ਕਰ ਰਿਹਾ ਹੈ।

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI ਨੇ Jalapeño ਦਾ अनाਹਰ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI ਇਨਫਰੈਂਸ ਚਿੱਪ

Nvidia GPUs 'ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਖਤਮ ਕਰਨਾ

Performance-per-Watt ਅਤੇ ਆਰਥਿਕ ਕੁਸ਼ਲਤਾ

ਵਰਟੀਕਲ ਇੰਟੀਗ੍ਰੇਸ਼ਨ: ਪੂਰੇ AI ਸਟੈਕ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ

ਮੁੱਖ ਗੱਲਾਂ

Continue reading

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI ਅਤੇ Broadcom ਨੇ Jalapeño ਨੂੰ ਪੇਸ਼ ਕੀਤਾ: LLM ਇਨਫਰੈਂਸ ਲਈ ਇੱਕ ਕਸਟਮ ਚਿੱਪ

Inside the Math: How OpenAI’s Jalapeño Chip Targets AI Economics

OpenAI’s Jalapeño Chip: A Strategic Shift Away from Nvidia Dominance

OpenAI Jalapeño ਚਿੱਪ: OpenAI ਕਿਵੇਂ AI ਲਾਗਤਾਂ ਨੂੰ 50% ਤੱਕ ਘਟਾਉਂਦਾ ਹੈ