OpenAI ਅਤੇ Broadcom ਨੇ Jalapeño ਪੇਸ਼ ਕੀਤਾ: LLM Inference ਲਈ ਇੱਕ ਕਸਟਮ ਚਿੱਪ

OpenAI "Jalapeño" ਦੇ ਐਲਾਨ ਨਾਲ ਕਸਟਮ ਸਿਲੀਕਾਨ ਦੇ ਖੇਤਰ ਵਿੱਚ ਉਤਰ ਕੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸੌਫਟਵੇਅਰ ਤੋਂ ਅੱਗੇ ਵਧ ਰਿਹਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਸਮਰਪਿਤ Intelligence Processor ਹੈ। Broadcom ਦੇ ਨਾਲ ਭਾਈਵਾਲੀ ਵਿੱਚ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, ਇਹ ਕਸਟਮ ਐਕਸਲਰੇਟਰ ਵੱਡੇ ਪੱਧਰ 'ਤੇ LLM inference ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।

ਆਧੁਨਿਕ LLMs ਲਈ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਤਿਆਰ ਕੀਤੀ ਗਈ ਆਰਕੀਟੈਕਚਰ

ਅਜਿਹੇ ਕਈ ਮੌਜੂਦਾ ਹੱਲਾਂ ਦੇ ਉਲਟ ਜੋ ਸੋਧੇ ਹੋਏ general-purpose GPUs 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ, Jalapeño ਇੱਕ ਅਜਿਹਾ ਡਿਜ਼ਾਈਨ ਹੈ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ LLM inference ਦੀਆਂ ਵਿਲੱਖਣ ਮੰਗਾਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸਦਾ ਉਦੇਸ਼ ਆਧੁਨਿਕ AI ਦੀਆਂ ਮੁੱਖ ਰੁਕਾਵਟਾਂ ਨੂੰ ਹੱਲ ਕਰਨਾ ਹੈ: ਡਾਟਾ ਦੀ ਹਰਕਤ (data movement) ਅਤੇ ਹਾਰਡਵੇਅਰ ਦੀ ਘੱਟ ਵਰਤੋਂ। ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲਿਤ ਕਰਕੇ ਕਿ ਵਰਤੋਂ ਇਸਦੀ ਸਿਧਾਂਤਕ ਵੱਧ ਤੋਂ ਵੱਧ ਸੀਮਾ ਦੇ ਨੇੜੇ ਹੋ ਜਾਵੇ, OpenAI ਦਾ ਟੀਚਾ ਮੌਜੂਦਾ ਅਤਿ-ਆਧੁਨਿਕ ਹਾਰਡਵੇਅਰ ਦੇ ਮੁਕਾਬਲੇ 'per watt' ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਕਰਨਾ ਹੈ।

ਹਾਲਾਂਕਿ OpenAI ਨੇ ਅਜੇ ਤੱਕ ਕੋਈ ਅੰਤਿਮ ਤਕਨੀਕੀ ਰਿਪੋਰਟ ਜਾਂ ਸੁਤੰਤਰ ਬੈਂਚਮਾਰਕ ਜਾਰੀ ਨਹੀਂ ਕੀਤੇ ਹਨ, ਪਰ ਸ਼ੁਰੂਆਤੀ ਅੰਦਰੂਨੀ ਟੈਸਟ ਕਾਫ਼ੀ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਵਾਧੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦੇ ਹਨ। ਇੰਜੀਨੀਅਰਿੰਗ ਸੈਂਪਲ ਪਹਿਲਾਂ ਹੀ ਲੈਬ ਵਾਤਾਵਰਣ ਵਿੱਚ ਗੁੰਝਲਦਾਰ machine learning ਵਰਕਲੋਡ ਚਲਾਉਣ ਲਈ ਵਰਤੇ ਜਾ ਰਹੇ ਹਨ, ਜਿਸ ਵਿੱਚ GPT-5.3-Codex-Spark ਮਾਡਲ ਸ਼ਾਮਲ ਹੈ—ਇੱਕ ਅਜਿਹਾ ਮਾਡਲ ਜੋ ਵਰਤਮਾਨ ਵਿੱਚ ਆਪਣੀਆਂ inference ਲੋੜਾਂ ਲਈ Cerebras ਹਾਰਡਵੇਅਰ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।

ਇੱਕ ਬਹੁ-ਕੰਪਨੀ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਹਿਯੋਗ

Jalapeño ਦਾ ਵਿਕਾਸ ਇੱਕ ਗੁੰਝਲਦਾਰ ਬਹੁ-ਭਾਈਵਾਲ ਯਤਨ ਹੈ ਜੋ ਪੂਰੇ ਹਾਰਡਵੇਅਰ ਸਟੈਕ ਤੱਕ ਫੈਲਿਆ ਹੋਇਆ ਹੈ। OpenAI ਚਿੱਪ ਡਿਜ਼ਾਈਨ ਦੀ ਅਗਵਾਈ ਕਰਦਾ ਹੈ, ਜੋ ਵਿਕਾਸ ਚੱਕਰ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਆਪਣੇ ਖੁਦ ਦੇ AI ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਰਿਪੋਰਟਾਂ ਅਨੁਸਾਰ ਡਿਜ਼ਾਈਨ ਤੋਂ tape-out ਤੱਕ ਸਿਰਫ਼ ਨੌਂ ਮਹੀਨੇ ਲੱਗੇ। Broadcom ਮਹੱਤਵਪੂਰਨ ਸਿਲੀਕਾਨ ਨਿਰਮਾਣ ਮਾਹਰਤਾ ਅਤੇ ਉੱਨਤ ਨੈੱਟਵਰਕਿੰਗ ਤਕਨਾਲੋਜੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਇਸਦੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ Tomahawk ਨੈੱਟਵਰਕਿੰਗ ਚਿੱਪਸ ਸ਼ਾਮਲ ਹਨ। ਇਸ ਈਕੋਸਿਸਟਮ ਨੂੰ ਪੂਰਾ ਕਰਦੇ ਹੋਏ, Celestica ਬੋਰਡਾਂ, ਰੈਕਾਂ ਅਤੇ ਪੂਰੇ ਸਿਸਟਮ ਇੱਕੀਕਰਨ (integration) ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਹੈ।

ਇਹ ਸਹਿਯੋਗ OpenAI ਲਈ ਇੱਕ ਰਣਨੀਤਕ ਤਬਦੀਲੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਸਿਰਫ਼ ਮਾਡਲਾਂ ਅਤੇ ਉਤਪਾਦਾਂ 'ਤੇ ਕੇਂਦਰਿਤ ਕੰਪਨੀ ਤੋਂ ਇੱਕ ਅਜਿਹੀ ਕੰਪਨੀ ਬਣ ਰਹੀ ਹੈ ਜੋ ਅ