OpenAI Jalapeño ചിപ്പ്: എങ്ങനെയാണ് OpenAI AI ചിലവുകൾ 50% കുറയ്ക്കുന്നത്?

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialകഴിഞ്ഞ ആഴ്‌ച2min read

OpenAI Jalapeño ചിപ്പ്: എങ്ങനെയാണ് OpenAI AI ചിലവുകൾ 50% കുറയ്ക്കുന്നത്?

OpenAI Jalapeño ചിപ്പ്: OpenAI എങ്ങനെയാണ് AI ചിലവുകൾ 50% കുറയ്ക്കുന്നത്

OpenAI-യും Broadcom-ഉം Jalapeño പുറത്തിറക്കി. ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (large language models) പ്രവർത്തിപ്പിക്കുക എന്ന ഒരൊറ്റ ലക്ഷ്യത്തിനായി നിർമ്മിച്ച ഒരു കസ്റ്റം ചിപ്പാണിത്.

Nvidia GPU-കളെ അപേക്ഷിച്ച് ഇൻഫറൻസ് (inference) ചിലവുകൾ 50% വരെ ഈ ചിപ്പ് കുറച്ചേക്കാം. എൻജിനീയറിങ് സാമ്പിളുകൾ ഇപ്പോൾ തന്നെ GPT-5.3-Codex-Spark പ്രവർത്തിപ്പിക്കുന്നുണ്ട്. 2026 അവസാനത്തോടെ ഇതിന്റെ വൻതോതിലുള്ള ഉൽപ്പാദനം ആരംഭിക്കും.

ChatGPT ഇൻഫറൻസിനായി OpenAI പ്രതിവർഷം ഏകദേശം 14 ബില്യൺ ഡോളർ ചെലവഴിക്കുന്നുണ്ട്. ഇത് അവരുടെ ആകെ വരുമാനത്തേക്കാൾ കൂടുതലാണ്. ഈ ചിലവ് 50% കുറയ്ക്കുന്നതിലൂടെ അവർക്ക് ഓരോ വർഷവും 7 ബില്യൺ ഡോളർ ലാഭിക്കാൻ കഴിയും. 2026-ൽ പ്രതീക്ഷിക്കുന്ന ഒരു IPO-യ്ക്കായി തയ്യാറെടുക്കാൻ ഈ നീക്കം OpenAI-യെ സഹായിക്കുന്നു.

ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു:

മിക്ക AI ഹാർഡ്‌വെയറുകളും GPU-കളാണ് ഉപയോഗിക്കുന്നത്. GPU-കൾ പൊതുവായ ഉപകരണങ്ങളാണ്. അവ ഗ്രാഫിക്സ്, ട്രെയിനിംഗ്, ഇൻഫറൻസ് എന്നിവ ചെയ്യുന്നു. ഈ വൈവിധ്യം അധിക ചിലവുകൾക്കും (overhead) കാരണമാകുന്നു.

Jalapeño ഒരു ASIC ആണ്. അതായത്, ഇത് ഒരു പ്രത്യേക ജോലിക്കായി നിർമ്മിച്ചതാണ്. മോഡലുകൾ ട്രെയിൻ ചെയ്തതിന് ശേഷം അവ പ്രവർത്തിപ്പിക്കുന്നതിൽ മാത്രമാണ് ഇത് ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. ഒരു സാധാരണ GPU-വിനേക്കാൾ കാര്യക്ഷമമായി മെമ്മറിയും നെറ്റ്‌വർക്കിംഗും കൈകാര്യം ചെയ്യാൻ ഇതിന് സാധിക്കും.

പ്രധാന വിവരങ്ങൾ:

• ഇത് TSMC 3nm സാങ്കേതികവിദ്യ ഉപയോഗിക്കുന്നു. • OpenAI ആണ് ഇതിന്റെ ആർക്കിടെക്ചർ രൂപകൽപ്പന ചെയ്തത്. • സിലിക്കൺ ഇംപ്ലിമെന്റേഷൻ (silicon implementation) Broadcom ആണ് നിർവ്വഹിച്ചത്. • ആദ്യ ബാച്ചിൽ 40% മൈക്രോസോഫ്റ്റ് വാങ്ങും.

ഈ ചിപ്പ് രൂപകൽപ്പന ചെയ്യാൻ OpenAI സ്വന്തം AI മോഡലുകൾ ഉപയോഗിച്ചു. AI കോഡുകൾ എഴുതുകയും ലേഔട്ടുകൾ ഒപ്റ്റിമൈസ് ചെയ്യുകയും ചെയ്തു. ഇത് ഒരു ചക്രം (loop) സൃഷ്ടിക്കുന്നു: മികച്ച ചിപ്പുകൾ രൂപകൽപ്പന ചെയ്യാൻ AI സഹായിക്കുന്നു, മികച്ച ചിപ്പുകൾ മികച്ച AI പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നു.

ഇത് നിങ്ങൾക്ക് എന്ത് അർത്ഥമാക്കുന്നു:

നിങ്ങൾ OpenAI API ഉപയോഗിക്കുന്നുണ്ടെങ്കിൽ, അടുത്ത 12 മുതൽ 18 മാസത്തിനുള്ളിൽ ഈ മാറ്റങ്ങൾ കാണാൻ സാധ്യതയുണ്ട്:

കുറഞ്ഞ API നിരക്കുകൾ: OpenAI-യുടെ ചിലവ് കുറയുന്നത് ഡെവലപ്പർമാർക്ക് കുറഞ്ഞ നിരക്കിൽ സേവനം ലഭ്യമാക്കാൻ സഹായിക്കും.
വേഗതയേറിയ പ്രവർത്തനം: ട്രാൻസ്ഫോർമർ മോഡലുകൾക്കായി (transformer models) പ്രത്യേകം തയ്യാറാക്കിയ ഈ ചിപ്പ് ലേറ്റൻസി (latency) കുറയ്ക്കുന്നു.
കുറഞ്ഞ സബ്‌സ്‌ക്രിപ്ഷൻ നിരക്കുകൾ: ChatGPT Plus വില കുറയാനോ കൂടുതൽ ഫീച്ചറുകൾ ഉൾപ്പെടുത്താനോ സാധ്യതയുണ്ട്.

പരിഗണിക്കേണ്ട ചില റിസ്ക്കുകൾ:

സ്വതന്ത്ര പരിശോധനകളില്ല: ലഭ്യമായ മിക്ക വിവരങ്ങളും OpenAI തന്നെ നൽകുന്നതാണ്.
പരിമിതമായ ഉപയോഗം: ഈ ചിപ്പിന് മോഡലുകൾ ട്രെയിൻ ചെയ്യാൻ കഴിയില്ല. ട്രെയിനിംഗിനായി നിങ്ങൾക്ക് ഇപ്പോഴും Nvidia ആവശ്യമാണ്.
പുതിയ ആശ്രിതത്വം: OpenAI, Nvidia-യിൽ നിന്ന് Broadcom-ലേക്ക് മാറുകയാണ്.
ഭാവി സാങ്കേതികവിദ്യ: AI മോഡലുകൾ അവയുടെ ഘടന മാറ്റുകയാണെങ്കിൽ, ഈ ചിപ്പിന്റെ മൂല്യം കുറയാൻ സാധ്യതയുണ്ട്.

OpenAI ഇപ്പോൾ വെറുമൊരു AI ലാബ് മാത്രമല്ല. അതൊരു ഇൻഫ്രാസ്ട്രക്ചർ കമ്പനിയായി മാറിക്കഴിഞ്ഞു. അവർക്ക് മോഡലുകളും സോഫ്റ്റ്‌വെയറും ഇപ്പോൾ ഹാർഡ്‌വെയറും നിയന്ത്രിക്കാൻ സാധിക്കുന്നു.

Source: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-costs-by-50%

Optional learning community: https://t.me/GyaanSetuAi

OpenAI Jalapeño ചിപ്പ്: എങ്ങനെയാണ് OpenAI AI ചിലവുകൾ 50% കുറയ്ക്കുന്നത്?

Continue reading

OpenAI Jalapeño അവതരിപ്പിച്ചു: അതിന്റെ ആദ്യത്തെ കസ്റ്റം AI ഇൻഫറൻസ് ചിപ്പ്

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI-യും Broadcom-ഉം Jalapeño പുറത്തിറക്കുന്നു: LLM ഇൻഫറൻസിനായി ഒരു കസ്റ്റം ചിപ്പ്

ഗണിതശാസ്ത്രത്തിന്റെ ഉള്ളറവുകൾ: OpenAI-യുടെ Jalapeño ചിപ്പ് എങ്ങനെയാണ് AI സാമ്പത്തികശാസ്ത്രത്തെ ലക്ഷ്യം വെക്കുന്നത്

OpenAI-യുടെ Jalapeño ചിപ്പ്: Nvidia-യുടെ ആധിപത്യത്തിൽ നിന്നുള്ള ഒരു തന്ത്രപരമായ മാറ്റം