OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

Translated for your language. Read the original.

AI-assisted draft.

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

In this article

OpenAI ਨੇ Jalapeño ਦਾ ਖੁਲਾਸਾ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI Inference Chip

OpenAI ਨੇ Broadcom ਦੇ ਸਹਿਯੋਗ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਗਏ ਇੱਕ ਕਸਟਮ-ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਇੰਟੈਲੀਜੈਂਸ ਪ੍ਰੋਸੈਸਰ, Jalapeño ਦੀ ਘੋਸ਼ਣਾ ਕਰਕੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸਿਲੀਕਾਨ ਦੀ ਦੌੜ ਵਿੱਚ ਪ੍ਰਵੇਸ਼ ਕਰ ਲਿਆ ਹੈ। ਇਹ ਰਣਨੀਤਕ ਕਦਮ ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਇਹ AI ਦਿੱਗਜ ਆਪਣੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਵਧਾਉਣ ਅਤੇ ਭਵਿੱਖ ਦੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (large language models) ਦੀ ਭਾਰੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਮੰਗਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਯੋਜਨਾ ਬਣਾ ਰਿਹਾ ਹੈ।

Nvidia ਤੋਂ ਅੱਗੇ ਵਧਣਾ: ASIC ਦਾ ਉਭਾਰ

ਸਾਲਾਂ ਤੋਂ, AI ਉਦਯੋਗ Nvidia ਦੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ GPUs ਨਾਲ ਜੁੜਿਆ ਹੋਇਆ ਰਿਹਾ ਹੈ। ਹਾਲਾਂਕਿ, OpenAI ਹੁਣ Jalapeño ਨਾਲ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਪਹੁੰਚ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ Application-Specific Integrated Circuit (ASIC) ਹੈ। ਆਮ ਉਦੇਸ਼ ਵਾਲੇ GPUs ਦੇ ਉਲਟ, ਇਹ ASIC ਖਾਸ ਤੌਰ 'ਤੇ AI inference ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ—ਇਹ ਉਹ ਮਹੱਤਵਪੂਰਨ ਪੜਾਅ ਹੈ ਜਿੱਥੇ ChatGPT ਜਾਂ Codex ਵਰਗਾ ਇੱਕ ਮਾਡਲ, ਰੀਅਲ-ਟਾਈਮ ਪ੍ਰਤੀਕਿਰਿਆ ਪੈਦਾ ਕਰਨ ਲਈ ਉਪਭੋਗਤਾ ਦੀ ਬੇਨਤੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ।

ਖਾਸ ਤੌਰ 'ਤੇ inference ਲਈ ਹਾਰਡਵੇਅਰ ਡਿਜ਼ਾਈਨ ਕਰਕੇ, OpenAI ਦਾ ਉਦੇਸ਼ ਆਪਣੇ ਮੌਜੂਦਾ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਕੁਸ਼ਲਤਾ ਨੂੰ ਸੁਧਾਰਨਾ ਹੈ। ਇਹ ਨੌਂ ਮਹੀਨੇ ਪਹਿਲਾਂ Broadcom ਨਾਲ ਕੀਤੀ ਗਈ ਭਾਈਵਾਲੀ ਤੋਂ ਬਾਅਦ ਹੋਇਆ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਖਾਸ ਤੌਰ 'ਤੇ Nvidia ਦੇ ਸੀਮਤ ਸਪਲਾਈ ਵਾਲੇ ਹਾਰਡਵੇਅਰ 'ਤੇ OpenAI ਦੀ ਭਾਰੀ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣਾ ਹੈ।

ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਉਦਯੋਗ ਦੇ ਦਿੱਗਜਾਂ ਦੇ ਬਰਾਬਰ ਪਹੁੰਚਣਾ

Jalapeño ਲਈ ਤਕਨੀਕੀ ਇੱਛਾਵਾਂ ਮਹੱਤਵਪੂਰਨ ਹਨ। Broadcom ਦੇ CEO Hock Tan ਨੇ ਕਿਹਾ ਹੈ ਕਿ ਚਿੱਪ ਨੂੰ ਉਦਯੋਗ ਦੇ ਬੈਂਚਮਾਰਕਸ, ਖਾਸ ਤੌਰ 'ਤੇ Nvidia ਦੇ Blackwell architecture ਅਤੇ Google ਦੇ Tensor Processing Units (TPUs) ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੋਣ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ।

ਜਦੋਂ ਕਿ Microsoft, Meta, ਅਤੇ Amazon ਵਰਗੇ ਮੁਕਾਬਲੇਵਾਰਾਂ ਨੇ ਵੀ ਆਪਣੇ ਡੇਟਾ ਸੈਂਟਰਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਕਸਟਮ ਸਿਲੀਕਾਨ ਲਾਂਚ ਕੀਤੇ ਹਨ, OpenAI ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮਾਪਦੰਡ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਰਿਹਾ ਹੈ: ਕੁਸ਼ਲਤਾ (efficiency)। ਸ਼ੁਰੂਆਤੀ ਟੈਸਟਿੰਗ ਤੋਂ ਸੰਕੇਤ ਮਿਲਦਾ ਹੈ ਕਿ Jalapeño ਅਜਿਹੀ performance-per-watt ਸਮਰੱਥਾ ਪ੍ਰਦਾਨ ਕਰੇਗਾ ਜੋ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਹੱਲਾਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਬਿਹਤਰ ਹੋਵੇਗੀ। ਵੱਡੇ ਪੱਧਰ 'ਤੇ AI ਤੈਨਾਤੀ ਦੀ ਦੁਨੀਆ ਵਿੱਚ, ਜਿੱਥੇ ਬਿਜਲੀ ਦੀ ਲਾਗਤ ਅਤੇ ਥਰਮਲ ਪ੍ਰਬੰਧਨ ਮੁੱਖ ਰੁਕਾਵਟਾਂ ਹਨ, ਇਹ ਕੁਸ਼ਲਤਾ ਦਾ ਫਾਇਦਾ ਇੱਕ ਨਿਰਣਾਇਕ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦਾ ਮਾਰਗ ਹੋ ਸਕਦਾ ਹੈ।

ਇੱਕ ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਕੰਪਿਊਟ ਰਣਨੀਤੀ

OpenAI Jalapeño ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਵਾਰ ਦੀ ਹਾਰਡਵੇਅਰ ਰਿਲੀਜ਼ ਵਜੋਂ ਨਹੀਂ ਦੇਖ ਰਿਹਾ ਹੈ। ਇਸ ਦੀ ਬਜਾਏ, ਕੰਪਨੀ ਇਸ ਨੂੰ "ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਕੰਪਿਊਟ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਪਹਿਲਾ ਕਦਮ" ਦੱਸਦੀ ਹੈ। ਇਹ ਇੱਕ ਲੰਬੇ ਸਮੇਂ ਦੇ ਰੋਡਮੈਪ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਜਿੱਥੇ ਇੱਕ ਵਰਟੀਕਲੀ ਇੰਟੀਗ੍ਰੇਟਡ ਸਟੈਕ ਬਣਾਇਆ ਜਾਵੇਗਾ, ਜਿੱਥੇ ਸਾਫਟਵੇਅਰ (LLMs) ਅਤੇ ਹਾਰਡਵੇਅਰ (ASICs) ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਸਿਨਰਜੀ ਲਈ ਇਕੱਠੇ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਜਾਵੇਗਾ।

ਕੰਪਨੀ ਨੂੰ ਉਮੀਦ ਹੈ ਕਿ ਉਹ 2026 ਦੇ ਅੰਤ ਤੱਕ ਇਸ ਨਵੇਂ ਕੰਪਿਊਟ ਪਲੇਟਫਾਰਮ ਨੂੰ ਤੈਨਾਤ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦੇਵੇਗੀ। ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲਾਂ ਦੀ ਗੁੰਝਲਦਾਰਤਾ ਵਧੇਗੀ ਅਤੇ agentic workflows ਵਧੇਰੇ ਆਮ ਹੋ ਜਾਣਗੇ, ਸਮਰਪਿਤ ਸਿਲੀਕਾਨ ਹੋਣ ਨਾਲ OpenAI ਨੂੰ ਲੇਟੈਂਸੀ (latency) ਘਟਾਉਣ ਅਤੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਫਰੰਟੀਅਰ-ਲੇਵਲ ਦੀ ਇੰਟੈਲੀਜੈਂਸ ਚਲਾਉਣ ਨਾਲ ਜੁੜੀਆਂ ਅਸਮਾਨੀ ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਵਿੱਚ ਮਦਦ ਮਿਲੇਗੀ।

AI Ecosystem ਲਈ ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਚਿੱਪ ਡਿਜ਼ਾਈਨ ਖੇਤਰ ਵਿੱਚ OpenAI ਦਾ ਪ੍ਰਵੇਸ਼ AI ਉਦਯੋਗ ਦੇ ਪਰਿਪੱਕ ਹੋਣ ਦਾ ਸੰਕੇਤ ਹੈ। ਅਸੀਂ "unconstrained hardware consumption" ਦੇ ਪੜਾਅ ਤੋਂ "specialized hardware optimization" ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ। ਜਿਵੇਂ-ਜਿਵੇਂ AI agents ਦੇ ਵਧਣ ਨਾਲ inference ਦੀ ਮੰਗ ਤੇਜ਼ੀ ਨਾਲ ਵਧੇਗੀ, ਅੰਡਰਲਾਈਂਗ ਸਿਲੀਕਾਨ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਇਹ ਨਿਰਧਾਰਤ ਕਰੇਗੀ ਕਿ ਕਿਹੜੀਆਂ ਕੰਪਨੀਆਂ ਟਿਕਾਊ ਤਰੀਕੇ ਨਾਲ ਵਧ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਕਿਹੜੀਆਂ GPU ਸਪਲਾਈ ਚੇਨ 'ਤੇ ਨਿਰਭਰ ਰਹਿਣਗੀਆਂ।

ਮੁੱਖ ਗੱਲਾਂ

ਵਿਸ਼ੇਸ਼ ਫੋਕਸ: Jalapeño ਇੱਕ ASIC ਹੈ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ AI inference ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ChatGPT ਵਰਗੇ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਰਫਤਾਰ ਅਤੇ ਲਾਗਤ ਨੂੰ ਆਪਟੀਮਾਈਜ਼ ਕਰਦਾ ਹੈ।
ਪ੍ਰਦਰਸ਼ਨ ਬੈਂਚਮਾਰਕਸ: Broadcom ਦੇ ਨਾਲ ਵਿਕਸਤ ਕੀਤੀ ਗਈ, ਇਹ ਚਿੱਪ Nvidia ਦੇ Blackwell ਅਤੇ Google ਦੇ TPUs ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਟੱਕਰ ਦੇਣ ਦਾ ਟੀਚਾ ਰੱਖਦੀ ਹੈ ਅਤੇ ਨਾਲ ਹੀ ਬਿਹਤਰ performance-per-watt ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।
ਲੰਬੇ ਸਮੇਂ ਦਾ ਰੋਡਮੈਪ: 2026 ਦੇ ਅੰਤ ਤੱਕ ਤੈਨਾਤ ਹੋਣ ਦੀ ਉਮੀਦ, Jalapeño ਤੀਜੀ-ਪਾਰਟੀ GPUs 'ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣ ਲਈ ਇੱਕ ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਹਾਰਡਵੇਅਰ ਪਲੇਟਫਾਰਮ ਦੀ ਨੀਂਹ ਹੈ।

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI ਨੇ Jalapeño ਦਾ ਖੁਲਾਸਾ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI Inference Chip

Nvidia ਤੋਂ ਅੱਗੇ ਵਧਣਾ: ASIC ਦਾ ਉਭਾਰ

ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਉਦਯੋਗ ਦੇ ਦਿੱਗਜਾਂ ਦੇ ਬਰਾਬਰ ਪਹੁੰਚਣਾ

ਇੱਕ ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਕੰਪਿਊਟ ਰਣਨੀਤੀ

AI Ecosystem ਲਈ ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਮੁੱਖ ਗੱਲਾਂ

Continue reading

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI ਅਤੇ Broadcom ਨੇ Jalapeño ਨੂੰ ਪੇਸ਼ ਕੀਤਾ: LLM ਇਨਫਰੈਂਸ ਲਈ ਇੱਕ ਕਸਟਮ ਚਿੱਪ

Inside the Math: How OpenAI’s Jalapeño Chip Targets AI Economics

OpenAI’s Jalapeño Chip: A Strategic Shift Away from Nvidia Dominance

OpenAI Jalapeño ਚਿੱਪ: OpenAI ਕਿਵੇਂ AI ਲਾਗਤਾਂ ਨੂੰ 50% ਤੱਕ ਘਟਾਉਂਦਾ ਹੈ