𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝘂𝗯𝗹𝗶𝗲 𝗱𝗲𝘀 𝗠𝗼𝗱è𝗹𝗲𝘀 à 𝗣𝗼𝗶𝗱𝘀 𝗢𝘂𝘃𝗲𝗿𝘁𝘀
OpenAI a publié des modèles à poids ouverts. Sam Altman a annoncé gpt-oss-120b et gpt-oss-20b. C'est la première fois qu'OpenAI publie des poids téléchargeables depuis 2019.
Ces modèles utilisent des licences de type Apache 2.0. Vous n'avez aucune restriction d'utilisation.
Détails des modèles :
- gpt-oss-120b : 120B dense. Utilisez-le pour le raisonnement, le codage et les agents.
- gpt-oss-20b : 20B dense. Utilisez-le pour des tâches sur l'appareil ou sensibles aux coûts.
Données de performance :
- MMLU : 89,7 %
- HumanEval : 92,4 %
- SWE-bench : 63,2 %
- Fenêtre de contexte : 256K tokens
Besoins matériels :
- Exécutez gpt-oss-20b sur une RTX 5090.
- Exécutez gpt-oss-120b sur 4x H100.
Vous pouvez utiliser LoRA et QLoRA pour le fine-tuning. Le support pour ollama, LM Studio et vLLM arrive d'ici 24 heures.
OpenAI répond à la concurrence de Meta, Anthropic et DeepSeek. Le marché de l'open-weight a un nouveau leader.
Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi