𝗢𝗽𝗲𝗻𝗔𝗜 𝗟𝗮𝗻𝘇𝗮 𝗠𝗼𝗱𝗲𝗹𝗼𝘀 𝗱𝗲 𝗣𝗲𝘀𝗼𝘀 𝗔𝗯𝗶𝗲𝗿𝘁𝗼𝘀
OpenAI ha lanzado modelos de pesos abiertos. Sam Altman anunció gpt-oss-120b y gpt-oss-20b. Esta es la primera vez que OpenAI lanza pesos descargables desde 2019.
Estos modelos utilizan licencias de estilo Apache 2.0. No tienes restricciones de uso.
Detalles del modelo:
- gpt-oss-120b: 120B denso. Úsalo para razonamiento, programación y agentes.
- gpt-oss-20b: 20B denso. Úsalo para tareas en el dispositivo o sensibles al costo.
Datos de rendimiento:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Ventana de contexto: 256K tokens
Requisitos de hardware:
- Ejecuta gpt-oss-20b en una RTX 5090.
- Ejecuta gpt-oss-120b en 4x H100s.
Puedes usar LoRA y QLoRA para el ajuste fino. El soporte para ollama, LM Studio y vLLM llegará en un plazo de 24 horas.
OpenAI está respondiendo a la competencia de Meta, Anthropic y DeepSeek. El mercado de pesos abiertos tiene un nuevo líder.
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi