𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝘂𝗯𝗹𝗶𝗲 𝗱𝗲𝘀 𝗠𝗼𝗱è𝗹𝗲𝘀 à 𝗣𝗼𝗶𝗱𝘀 𝗢𝘂𝘃𝗲𝗿𝘁𝘀

OpenAI a publié des modèles à poids ouverts. Sam Altman a annoncé gpt-oss-120b et gpt-oss-20b. C'est la première fois qu'OpenAI publie des poids téléchargeables depuis 2019.

Ces modèles utilisent des licences de type Apache 2.0. Vous n'avez aucune restriction d'utilisation.

Détails des modèles :

  • gpt-oss-120b : 120B dense. Utilisez-le pour le raisonnement, le codage et les agents.
  • gpt-oss-20b : 20B dense. Utilisez-le pour des tâches sur l'appareil ou sensibles aux coûts.

Données de performance :

  • MMLU : 89,7 %
  • HumanEval : 92,4 %
  • SWE-bench : 63,2 %
  • Fenêtre de contexte : 256K tokens

Besoins matériels :

  • Exécutez gpt-oss-20b sur une RTX 5090.
  • Exécutez gpt-oss-120b sur 4x H100.

Vous pouvez utiliser LoRA et QLoRA pour le fine-tuning. Le support pour ollama, LM Studio et vLLM arrive d'ici 24 heures.

OpenAI répond à la concurrence de Meta, Anthropic et DeepSeek. Le marché de l'open-weight a un nouveau leader.

Source : https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi