𝗢𝗽𝗲𝗻𝗔𝗜 𝗥𝗲𝗹𝗮𝘀𝗰𝗶𝗮 𝗠𝗼𝗱𝗲𝗹𝗹𝗶 𝗢𝗽𝗲𝗻-𝗪𝗲𝗶𝗴𝗵𝘁
OpenAI ha rilasciato modelli open-weight. Sam Altman ha annunciato gpt-oss-120b e gpt-oss-20b. Questa è la prima volta che OpenAI rilascia pesi scaricabili dal 2019.
Questi modelli utilizzano licenze in stile Apache 2.0. Non ci sono restrizioni sull'uso.
Dettagli del modello:
- gpt-oss-120b: 120B dense. Utilizzalo per ragionamento, coding e agenti.
- gpt-oss-20b: 20B dense. Utilizzalo per task on-device o sensibili ai costi.
Dati sulle prestazioni:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Finestra di contesto: 256K token
Requisiti hardware:
- Esegui gpt-oss-20b su una RTX 5090.
- Esegui gpt-oss-120b su 4x H100.
Puoi utilizzare LoRA e QLoRA per il fine-tuning. Il supporto per ollama, LM Studio e vLLM arriverà entro 24 ore.
OpenAI sta rispondendo alla concorrenza di Meta, Anthropic e DeepSeek. Il mercato degli open-weight ha un nuovo leader.
Community di apprendimento opzionale: https://t.me/GyaanSetuAi