OpenAI జాలపెనో చిప్: OpenAI AI ఖర్చులను 50% ఎలా తగ్గిస్తుంది?

Translated for your language. Read the original.

AI-assisted draft.

OpenAI జాలపెనో చిప్: OpenAI AI ఖర్చులను 50% ఎలా తగ్గిస్తుంది?

OpenAI Jalapeño చిప్: OpenAI AI ఖర్చులను 50% ఎలా తగ్గిస్తుంది

OpenAI మరియు Broadcom ఇప్పుడే Jalapeñoని వెల్లడించాయి. ఇది ఒకే ఒక పని కోసం రూపొందించబడిన కస్టమ్ చిప్: లార్జ్ లాంగ్వేజ్ మోడల్స్ (large language models) రన్ చేయడం.

Nvidia GPUsతో పోలిస్తే ఈ చిప్ ఇన్ఫరెన్స్ (inference) ఖర్చులను 50% తగ్గించగలదు. ఇంజనీరింగ్ శాంపిల్స్ ఇప్పటికే GPT-5.3-Codex-Sparkను రన్ చేస్తున్నాయి. 2026 చివరి నాటికి దీని భారీ ఉత్పత్తి (mass production) ప్రారంభమవుతుంది.

OpenAI ప్రతి సంవత్సరం ChatGPT ఇన్ఫరెన్స్ కోసం సుమారు $14 బిలియన్లను ఖర్చు చేస్తోంది. ఇది వారి మొత్తం ఆదాయం కంటే ఎక్కువ. ఈ ఖర్చును 50% తగ్గించడం వల్ల వారికి ప్రతి సంవత్సరం $7 బిలియన్లు ఆదా అవుతాయి. ఈ చర్య 2026లో రాబోయే IPO కోసం OpenAI సిద్ధమవడానికి సహాయపడుతుంది.

How it works:

చాలా AI హార్డ్‌వేర్‌లు GPUsని ఉపయోగిస్తాయి. GPUs అనేవి జనరల్ టూల్స్. అవి గ్రాఫిక్స్, ట్రైనింగ్ మరియు ఇన్ఫరెన్స్‌ను నిర్వహిస్తాయి. ఈ ఫ్లెక్సిబిలిటీ వల్ల అదనపు ఖర్చు (overhead) పెరుగుతుంది.

Jalapeño ఒక ASIC. అంటే ఇది ఒక నిర్దిష్ట పని కోసం నిర్మించబడింది. మోడల్స్ ట్రైన్ అయిన తర్వాత వాటిని రన్ చేయడంపైనే ఇది దృష్టి పెడుతుంది. ఇది ఒక జనరల్ GPU కంటే మెమరీ మరియు నెట్‌వర్కింగ్‌ను మరింత సమర్థవంతంగా నిర్వహిస్తుంది.

Key details:

• ఇది TSMC 3nm టెక్నాలజీని ఉపయోగిస్తుంది. • OpenAI దీని ఆర్కిటెక్చర్‌ను రూపొందించింది. • Broadcom సిలికాన్ ఇంప్లిమెంటేషన్‌ను నిర్వహించింది. • మొదటి బ్యాచ్‌లో 40%ను Microsoft కొనుగోలు చేస్తుంది.

OpenAI ఈ చిప్‌ను రూపొందించడానికి తన స్వంత AI మోడల్స్‌ను ఉపయోగించింది. AI కోడ్‌ను రాసింది మరియు లేఅవుట్‌లను ఆప్టిమైజ్ చేసింది. ఇది ఒక లూప్‌ను సృష్టిస్తుంది: AI మెరుగైన చిప్‌లను రూపొందించడంలో సహాయపడుతుంది, మరియు మెరుగైన చిప్‌లు మెరుగైన AIని రన్ చేస్తాయి.

What this means for you:

మీరు OpenAI APIని ఉపయోగిస్తుంటే, రాబోయే 12 నుండి 18 నెలల్లో ఈ మార్పులను చూడవచ్చు:

తక్కువ API ధరలు: OpenAI ఖర్చులు తగ్గడం వల్ల డెవలపర్లకు తక్కువ ధరకే రేట్లు లభిస్తాయి.
వేగవంతమైన వేగం: ఈ చిప్ ట్రాన్స్‌ఫార్మర్ మోడల్స్ (transformer models) కోసం ప్రత్యేకంగా రూపొందించబడింది, ఇది లాటెన్సీని (latency) తగ్గిస్తుంది.
చౌకైన సబ్‌స్క్రిప్షన్లు: ChatGPT Plus ధరలు తగ్గవచ్చు లేదా మరిన్ని ఫీచర్లను కలిగి ఉండవచ్చు.

There are risks to consider:

స్వతంత్ర పరీక్షలు లేవు: ఎక్కువ డేటా OpenAI నుండి మాత్రమే వస్తోంది.
పరిమిత వినియోగం: ఈ చిప్ మోడల్స్‌ను ట్రైన్ చేయలేదు. ట్రైనింగ్ కోసం మీకు ఇంకా Nvidia అవసరమవుతుంది.
కొత్త డిపెండెన్సీ: OpenAI, Nvidia నుండి Broadcom వైపు మళ్లుతోంది.
భవిష్యత్తు సాంకేతికత: ఒకవేళ AI మోడల్స్ వాటి నిర్మాణాన్ని మార్చుకుంటే, ఈ చిప్ విలువ తగ్గే అవకాశం ఉంది.

OpenAI ఇప్పుడు కేవలం ఒక AI ల్యాబ్ మాత్రమే కాదు. ఇది ఇప్పుడు ఒక ఇన్‌ఫ్రాస్ట్రక్చర్ కంపెనీ. వారు మోడల్స్, సాఫ్ట్‌వేర్ మరియు ఇప్పుడు హార్డ్‌వేర్‌ను కూడా నియంత్రిస్తున్నారు.

Source: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-costs-by-50%

Optional learning community: https://t.me/GyaanSetuAi

OpenAI జాలపెనో చిప్: OpenAI AI ఖర్చులను 50% ఎలా తగ్గిస్తుంది?

Continue reading

OpenAI 'Jalapeño'ను ఆవిష్కరించింది: ఇది దాని మొట్టమొదటి కస్టమ్ AI ఇన్‌ఫరెన్స్ చిప్

OpenAI 'Jalapeño'ను ఆవిష్కరించింది: దాని మొదటి కస్టమ్ AI ఇన్‌ఫరెన్స్ చిప్

OpenAI and Broadcom Unveil Jalapeño: A Custom Chip for LLM Inference

గణిత విశ్లేషణ: OpenAI యొక్క Jalapeño చిప్ AI ఎకనామిక్స్‌ను ఎలా లక్ష్యంగా చేసుకుంటుంది

OpenAI’s Jalapeño Chip: A Strategic Shift Away from Nvidia Dominance