OpenAI ਨੇ Jalapeño ਦਾ ਖੁਲਾਸਾ ਕੀਤਾ: ਇਸਦਾ ਪਹਿਲਾ ਕਸਟਮ AI Inference Chip
OpenAI ਨੇ Broadcom ਦੇ ਸਹਿਯੋਗ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਗਏ ਇੱਕ ਕਸਟਮ-ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਇੰਟੈਲੀਜੈਂਸ ਪ੍ਰੋਸੈਸਰ, Jalapeño ਦੀ ਘੋਸ਼ਣਾ ਕਰਕੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸਿਲੀਕਾਨ ਦੀ ਦੌੜ ਵਿੱਚ ਪ੍ਰਵੇਸ਼ ਕਰ ਲਿਆ ਹੈ। ਇਹ ਰਣਨੀਤਕ ਕਦਮ ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਇਹ AI ਦਿੱਗਜ ਆਪਣੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਵਧਾਉਣ ਅਤੇ ਭਵਿੱਖ ਦੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (large language models) ਦੀ ਭਾਰੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਮੰਗਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਯੋਜਨਾ ਬਣਾ ਰਿਹਾ ਹੈ।
Nvidia ਤੋਂ ਅੱਗੇ ਵਧਣਾ: ASIC ਦਾ ਉਭਾਰ
ਸਾਲਾਂ ਤੋਂ, AI ਉਦਯੋਗ Nvidia ਦੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ GPUs ਨਾਲ ਜੁੜਿਆ ਹੋਇਆ ਰਿਹਾ ਹੈ। ਹਾਲਾਂਕਿ, OpenAI ਹੁਣ Jalapeño ਨਾਲ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਪਹੁੰਚ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ Application-Specific Integrated Circuit (ASIC) ਹੈ। ਆਮ ਉਦੇਸ਼ ਵਾਲੇ GPUs ਦੇ ਉਲਟ, ਇਹ ASIC ਖਾਸ ਤੌਰ 'ਤੇ AI inference ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ—ਇਹ ਉਹ ਮਹੱਤਵਪੂਰਨ ਪੜਾਅ ਹੈ ਜਿੱਥੇ ChatGPT ਜਾਂ Codex ਵਰਗਾ ਇੱਕ ਮਾਡਲ, ਰੀਅਲ-ਟਾਈਮ ਪ੍ਰਤੀਕਿਰਿਆ ਪੈਦਾ ਕਰਨ ਲਈ ਉਪਭੋਗਤਾ ਦੀ ਬੇਨਤੀ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ।
ਖਾਸ ਤੌਰ 'ਤੇ inference ਲਈ ਹਾਰਡਵੇਅਰ ਡਿਜ਼ਾਈਨ ਕਰਕੇ, OpenAI ਦਾ ਉਦੇਸ਼ ਆਪਣੇ ਮੌਜੂਦਾ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਕੁਸ਼ਲਤਾ ਨੂੰ ਸੁਧਾਰਨਾ ਹੈ। ਇਹ ਨੌਂ ਮਹੀਨੇ ਪਹਿਲਾਂ Broadcom ਨਾਲ ਕੀਤੀ ਗਈ ਭਾਈਵਾਲੀ ਤੋਂ ਬਾਅਦ ਹੋਇਆ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਖਾਸ ਤੌਰ 'ਤੇ Nvidia ਦੇ ਸੀਮਤ ਸਪਲਾਈ ਵਾਲੇ ਹਾਰਡਵੇਅਰ 'ਤੇ OpenAI ਦੀ ਭਾਰੀ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣਾ ਹੈ।
ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਉਦਯੋਗ ਦੇ ਦਿੱਗਜਾਂ ਦੇ ਬਰਾਬਰ ਪਹੁੰਚਣਾ
Jalapeño ਲਈ ਤਕਨੀਕੀ ਇੱਛਾਵਾਂ ਮਹੱਤਵਪੂਰਨ ਹਨ। Broadcom ਦੇ CEO Hock Tan ਨੇ ਕਿਹਾ ਹੈ ਕਿ ਚਿੱਪ ਨੂੰ ਉਦਯੋਗ ਦੇ ਬੈਂਚਮਾਰਕਸ, ਖਾਸ ਤੌਰ 'ਤੇ Nvidia ਦੇ Blackwell architecture ਅਤੇ Google ਦੇ Tensor Processing Units (TPUs) ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੋਣ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ।
ਜਦੋਂ ਕਿ Microsoft, Meta, ਅਤੇ Amazon ਵਰਗੇ ਮੁਕਾਬਲੇਵਾਰਾਂ ਨੇ ਵੀ ਆਪਣੇ ਡੇਟਾ ਸੈਂਟਰਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਕਸਟਮ ਸਿਲੀਕਾਨ ਲਾਂਚ ਕੀਤੇ ਹਨ, OpenAI ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮਾਪਦੰਡ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਰਿਹਾ ਹੈ: ਕੁਸ਼ਲਤਾ (efficiency)। ਸ਼ੁਰੂਆਤੀ ਟੈਸਟਿੰਗ ਤੋਂ ਸੰਕੇਤ ਮਿਲਦਾ ਹੈ ਕਿ Jalapeño ਅਜਿਹੀ performance-per-watt ਸਮਰੱਥਾ ਪ੍ਰਦਾਨ ਕਰੇਗਾ ਜੋ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਹੱਲਾਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਬਿਹਤਰ ਹੋਵੇਗੀ। ਵੱਡੇ ਪੱਧਰ 'ਤੇ AI ਤੈਨਾਤੀ ਦੀ ਦੁਨੀਆ ਵਿੱਚ, ਜਿੱਥੇ ਬਿਜਲੀ ਦੀ ਲਾਗਤ ਅਤੇ ਥਰਮਲ ਪ੍ਰਬੰਧਨ ਮੁੱਖ ਰੁਕਾਵਟਾਂ ਹਨ, ਇਹ ਕੁਸ਼ਲਤਾ ਦਾ ਫਾਇਦਾ ਇੱਕ ਨਿਰਣਾਇਕ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦਾ ਮਾਰਗ ਹੋ ਸਕਦਾ ਹੈ।
ਇੱਕ ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਕੰਪਿਊਟ ਰਣਨੀਤੀ
OpenAI Jalapeño ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਵਾਰ ਦੀ ਹਾਰਡਵੇਅਰ ਰਿਲੀਜ਼ ਵਜੋਂ ਨਹੀਂ ਦੇਖ ਰਿਹਾ ਹੈ। ਇਸ ਦੀ ਬਜਾਏ, ਕੰਪਨੀ ਇਸ ਨੂੰ "ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਕੰਪਿਊਟ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਪਹਿਲਾ ਕਦਮ" ਦੱਸਦੀ ਹੈ। ਇਹ ਇੱਕ ਲੰਬੇ ਸਮੇਂ ਦੇ ਰੋਡਮੈਪ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਜਿੱਥੇ ਇੱਕ ਵਰਟੀਕਲੀ ਇੰਟੀਗ੍ਰੇਟਡ ਸਟੈਕ ਬਣਾਇਆ ਜਾਵੇਗਾ, ਜਿੱਥੇ ਸਾਫਟਵੇਅਰ (LLMs) ਅਤੇ ਹਾਰਡਵੇਅਰ (ASICs) ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਸਿਨਰਜੀ ਲਈ ਇਕੱਠੇ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਜਾਵੇਗਾ।
ਕੰਪਨੀ ਨੂੰ ਉਮੀਦ ਹੈ ਕਿ ਉਹ 2026 ਦੇ ਅੰਤ ਤੱਕ ਇਸ ਨਵੇਂ ਕੰਪਿਊਟ ਪਲੇਟਫਾਰਮ ਨੂੰ ਤੈਨਾਤ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦੇਵੇਗੀ। ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲਾਂ ਦੀ ਗੁੰਝਲਦਾਰਤਾ ਵਧੇਗੀ ਅਤੇ agentic workflows ਵਧੇਰੇ ਆਮ ਹੋ ਜਾਣਗੇ, ਸਮਰਪਿਤ ਸਿਲੀਕਾਨ ਹੋਣ ਨਾਲ OpenAI ਨੂੰ ਲੇਟੈਂਸੀ (latency) ਘਟਾਉਣ ਅਤੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਫਰੰਟੀਅਰ-ਲੇਵਲ ਦੀ ਇੰਟੈਲੀਜੈਂਸ ਚਲਾਉਣ ਨਾਲ ਜੁੜੀਆਂ ਅਸਮਾਨੀ ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਵਿੱਚ ਮਦਦ ਮਿਲੇਗੀ।
AI Ecosystem ਲਈ ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ
ਚਿੱਪ ਡਿਜ਼ਾਈਨ ਖੇਤਰ ਵਿੱਚ OpenAI ਦਾ ਪ੍ਰਵੇਸ਼ AI ਉਦਯੋਗ ਦੇ ਪਰਿਪੱਕ ਹੋਣ ਦਾ ਸੰਕੇਤ ਹੈ। ਅਸੀਂ "unconstrained hardware consumption" ਦੇ ਪੜਾਅ ਤੋਂ "specialized hardware optimization" ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ। ਜਿਵੇਂ-ਜਿਵੇਂ AI agents ਦੇ ਵਧਣ ਨਾਲ inference ਦੀ ਮੰਗ ਤੇਜ਼ੀ ਨਾਲ ਵਧੇਗੀ, ਅੰਡਰਲਾਈਂਗ ਸਿਲੀਕਾਨ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਇਹ ਨਿਰਧਾਰਤ ਕਰੇਗੀ ਕਿ ਕਿਹੜੀਆਂ ਕੰਪਨੀਆਂ ਟਿਕਾਊ ਤਰੀਕੇ ਨਾਲ ਵਧ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਕਿਹੜੀਆਂ GPU ਸਪਲਾਈ ਚੇਨ 'ਤੇ ਨਿਰਭਰ ਰਹਿਣਗੀਆਂ।
ਮੁੱਖ ਗੱਲਾਂ
- ਵਿਸ਼ੇਸ਼ ਫੋਕਸ: Jalapeño ਇੱਕ ASIC ਹੈ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ AI inference ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ChatGPT ਵਰਗੇ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਰਫਤਾਰ ਅਤੇ ਲਾਗਤ ਨੂੰ ਆਪਟੀਮਾਈਜ਼ ਕਰਦਾ ਹੈ।
- ਪ੍ਰਦਰਸ਼ਨ ਬੈਂਚਮਾਰਕਸ: Broadcom ਦੇ ਨਾਲ ਵਿਕਸਤ ਕੀਤੀ ਗਈ, ਇਹ ਚਿੱਪ Nvidia ਦੇ Blackwell ਅਤੇ Google ਦੇ TPUs ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਟੱਕਰ ਦੇਣ ਦਾ ਟੀਚਾ ਰੱਖਦੀ ਹੈ ਅਤੇ ਨਾਲ ਹੀ ਬਿਹਤਰ performance-per-watt ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।
- ਲੰਬੇ ਸਮੇਂ ਦਾ ਰੋਡਮੈਪ: 2026 ਦੇ ਅੰਤ ਤੱਕ ਤੈਨਾਤ ਹੋਣ ਦੀ ਉਮੀਦ, Jalapeño ਤੀਜੀ-ਪਾਰਟੀ GPUs 'ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣ ਲਈ ਇੱਕ ਮਲਟੀ-ਜਨਰੇਸ਼ਨ ਹਾਰਡਵੇਅਰ ਪਲੇਟਫਾਰਮ ਦੀ ਨੀਂਹ ਹੈ।
