OpenAI એ ઓપન-વેઇટ મોડલ્સ રિલીઝ કર્યા

OpenAI એ ઓપન-વેઇટ મોડલ્સ રિલીઝ કર્યા છે. Sam Altman એ gpt-oss-120b અને gpt-oss-20b ની જાહેરાત કરી છે. 2019 પછી આ પ્રથમ વખત છે જ્યારે OpenAI એ ડાઉનલોડ કરી શકાય તેવા weights રિલીઝ કર્યા છે.

આ મોડલ્સ Apache 2.0-શૈલીના લાયસન્સનો ઉપયોગ કરે છે. તેના ઉપયોગ પર તમારી પાસે કોઈ પ્રતિબંધો નથી.

મોડલની વિગતો:

  • gpt-oss-120b: 120B dense. આનો ઉપયોગ reasoning, coding અને agents માટે કરો.
  • gpt-oss-20b: 20B dense. આનો ઉપયોગ on-device અથવા cost-sensitive કાર્યો માટે કરો.

પરફોર્મન્સ ડેટા:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Context window: 256K tokens

હાર્ડવેરની જરૂરિયાતો:

  • gpt-oss-20b ને RTX 5090 પર ચલાવો.
  • gpt-oss-120b ને 4x H100s પર ચલાવો.

તમે fine-tuning માટે LoRA અને QLoRA નો ઉપયોગ કરી શકો છો. ollama, LM Studio, અને vLLM માટે સપોર્ટ 24 કલાકની અંદર આવી જશે.

OpenAI એ Meta, Anthropic, અને DeepSeek તરફથી મળી રહેલી સ્પર્ધાનો જવાબ આપી રહ્યો છે. ઓપન-વેઇટ માર્કેટમાં હવે એક નવો લીડર છે.

સ્ત્રોત: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi