𝗢𝗽𝗲𝗻𝗔𝗜 𝗟𝗮𝗻𝘇𝗮 𝗠𝗼𝗱𝗲𝗹𝗼𝘀 𝗱𝗲 𝗣𝗲𝘀𝗼𝘀 𝗔𝗯𝗶𝗲𝗿𝘁𝗼𝘀

OpenAI ha lanzado modelos de pesos abiertos. Sam Altman anunció gpt-oss-120b y gpt-oss-20b. Esta es la primera vez que OpenAI lanza pesos descargables desde 2019.

Estos modelos utilizan licencias de estilo Apache 2.0. No tienes restricciones de uso.

Detalles del modelo:

  • gpt-oss-120b: 120B denso. Úsalo para razonamiento, programación y agentes.
  • gpt-oss-20b: 20B denso. Úsalo para tareas en el dispositivo o sensibles al costo.

Datos de rendimiento:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Ventana de contexto: 256K tokens

Requisitos de hardware:

  • Ejecuta gpt-oss-20b en una RTX 5090.
  • Ejecuta gpt-oss-120b en 4x H100s.

Puedes usar LoRA y QLoRA para el ajuste fino. El soporte para ollama, LM Studio y vLLM llegará en un plazo de 24 horas.

OpenAI está respondiendo a la competencia de Meta, Anthropic y DeepSeek. El mercado de pesos abiertos tiene un nuevo líder.

Fuente: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi