OpenAI Jalapeño Chip: कैसे OpenAI AI लागत में 50% की कटौती करता है

OpenAI और Broadcom ने अभी Jalapeño का अनावरण किया है। यह एक कस्टम चिप है जिसे केवल एक काम के लिए बनाया गया है: लार्ज लैंग्वेज मॉडल्स (large language models) को चलाना।

यह चिप Nvidia GPUs की तुलना में इन्फरेंस (inference) लागत को 50% तक कम कर सकती है। इंजीनियरिंग सैंपल्स पहले से ही GPT-5.3-Codex-Spark चला रहे हैं। इसका बड़े पैमाने पर उत्पादन (mass production) 2026 के अंत तक शुरू हो जाएगा।

OpenAI ChatGPT इन्फरेंस पर सालाना लगभग $14 बिलियन खर्च करता है। यह उनके कुल राजस्व (revenue) से भी अधिक है। इस लागत को 50% कम करने से उनके सालाना $7 बिलियन की बचत होगी। यह कदम OpenAI को संभावित 2026 IPO के लिए तैयार होने में मदद करता है।

यह कैसे काम करता है:

अधिकांश AI हार्डवेयर GPUs का उपयोग करते हैं। GPUs सामान्य उपकरण (general tools) हैं। वे ग्राफिक्स, ट्रेनिंग और इन्फरेंस का काम करते हैं। यह लचीलापन अतिरिक्त ओवरहेड (overhead) पैदा करता है।

Jalapeño एक ASIC है। इसका मतलब है कि इसे एक विशिष्ट कार्य के लिए बनाया गया है। यह केवल मॉडल्स के प्रशिक्षित (trained) होने के बाद उन्हें चलाने पर ध्यान केंद्रित करता है। यह एक सामान्य GPU की तुलना में मेमोरी और नेटवर्किंग को अधिक कुशलता से संभालता है।

मुख्य विवरण:

• यह TSMC 3nm तकनीक का उपयोग करता है। • OpenAI ने इसका आर्किटेक्चर डिजाइन किया है। • Broadcom ने सिलिकॉन इम्प्लीमेंटेशन संभाला है। • Microsoft पहले बैच का 40% खरीदेगा।

OpenAI ने इस चिप को डिजाइन करने के लिए अपने स्वयं के AI मॉडल्स का उपयोग किया। AI ने कोड लिखा और लेआउट को ऑप्टिमाइज़ किया। यह एक चक्र (loop) बनाता है: AI बेहतर चिप्स डिजाइन करने में मदद करता है, और बेहतर चिप्स बेहतर AI चलाते हैं।

इसका आपके लिए क्या मतलब है:

यदि आप OpenAI API का उपयोग करते हैं, तो आप 12 से 18 महीनों में ये बदलाव देख सकते हैं:

  • कम API कीमतें: OpenAI के लिए कम लागत डेवलपर्स के लिए सस्ती दरों की अनुमति देती है।
  • तेज़ गति: यह चिप ट्रांसफॉर्मर मॉडल्स (transformer models) के लिए ट्यून की गई है, जिससे लेटेंसी (latency) कम हो जाती है।
  • सस्ते सब्सक्रिप्शन: ChatGPT Plus की कीमतें कम हो सकती हैं या इसमें अधिक फीचर्स शामिल हो सकते हैं।

विचार करने योग्य जोखिम:

  • कोई स्वतंत्र परीक्षण नहीं: अधिकांश डेटा स्वयं OpenAI से आता है।
  • सीमित उपयोग: यह चिप मॉडल्स को ट्रेन नहीं कर सकती। ट्रेनिंग के लिए आपको अभी भी Nvidia की आवश्यकता होगी।
  • नई निर्भरता: OpenAI, Nvidia से Broadcom की ओर बढ़ रहा है।
  • भविष्य की तकनीक: यदि AI मॉडल्स अपनी संरचना बदलते हैं, तो इस चिप का मूल्य कम हो सकता है।

OpenAI अब केवल एक AI लैब नहीं रह गया है। यह अब एक इंफ्रास्ट्रक्चर कंपनी है। वे मॉडल्स, सॉफ्टवेयर और अब हार्डवेयर को भी नियंत्रित करते हैं।

Source: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-costs-by-50%

Optional learning community: https://t.me/GyaanSetuAi