OpenAI એ ઓપન-વેઇટ મોડલ્સ રિલીઝ કર્યા
OpenAI એ ઓપન-વેઇટ મોડલ્સ રિલીઝ કર્યા છે. Sam Altman એ gpt-oss-120b અને gpt-oss-20b ની જાહેરાત કરી છે. 2019 પછી આ પ્રથમ વખત છે જ્યારે OpenAI એ ડાઉનલોડ કરી શકાય તેવા weights રિલીઝ કર્યા છે.
આ મોડલ્સ Apache 2.0-શૈલીના લાયસન્સનો ઉપયોગ કરે છે. તેના ઉપયોગ પર તમારી પાસે કોઈ પ્રતિબંધો નથી.
મોડલની વિગતો:
- gpt-oss-120b: 120B dense. આનો ઉપયોગ reasoning, coding અને agents માટે કરો.
- gpt-oss-20b: 20B dense. આનો ઉપયોગ on-device અથવા cost-sensitive કાર્યો માટે કરો.
પરફોર્મન્સ ડેટા:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Context window: 256K tokens
હાર્ડવેરની જરૂરિયાતો:
- gpt-oss-20b ને RTX 5090 પર ચલાવો.
- gpt-oss-120b ને 4x H100s પર ચલાવો.
તમે fine-tuning માટે LoRA અને QLoRA નો ઉપયોગ કરી શકો છો. ollama, LM Studio, અને vLLM માટે સપોર્ટ 24 કલાકની અંદર આવી જશે.
OpenAI એ Meta, Anthropic, અને DeepSeek તરફથી મળી રહેલી સ્પર્ધાનો જવાબ આપી રહ્યો છે. ઓપન-વેઇટ માર્કેટમાં હવે એક નવો લીડર છે.
વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi