𝗢𝗽𝗲𝗻𝗔𝗜 𝗥𝗲𝗹𝗮𝘀𝗰𝗶𝗮 𝗠𝗼𝗱𝗲𝗹𝗹𝗶 𝗢𝗽𝗲𝗻-𝗪𝗲𝗶𝗴𝗵𝘁

OpenAI ha rilasciato modelli open-weight. Sam Altman ha annunciato gpt-oss-120b e gpt-oss-20b. Questa è la prima volta che OpenAI rilascia pesi scaricabili dal 2019.

Questi modelli utilizzano licenze in stile Apache 2.0. Non ci sono restrizioni sull'uso.

Dettagli del modello:

  • gpt-oss-120b: 120B dense. Utilizzalo per ragionamento, coding e agenti.
  • gpt-oss-20b: 20B dense. Utilizzalo per task on-device o sensibili ai costi.

Dati sulle prestazioni:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Finestra di contesto: 256K token

Requisiti hardware:

  • Esegui gpt-oss-20b su una RTX 5090.
  • Esegui gpt-oss-120b su 4x H100.

Puoi utilizzare LoRA e QLoRA per il fine-tuning. Il supporto per ollama, LM Studio e vLLM arriverà entro 24 ore.

OpenAI sta rispondendo alla concorrenza di Meta, Anthropic e DeepSeek. Il mercato degli open-weight ha un nuovo leader.

Fonte: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Community di apprendimento opzionale: https://t.me/GyaanSetuAi