OpenAI випускає моделі з відкритими вагами
OpenAI випустила моделі з відкритими вагами. Сем Альтман анонсував gpt-oss-120b та gpt-oss-20b. Це перший випадок з 2019 року, коли OpenAI випустила ваги для завантаження.
Ці моделі використовують ліцензії типу Apache 2.0. Ви не маєте жодних обмежень щодо використання.
Деталі моделей:
- gpt-oss-120b: 120B dense. Використовуйте її для міркувань, програмування та агентів.
- gpt-oss-20b: 20B dense. Використовуйте її для завдань на пристроях або завдань, чутливих до вартості.
Дані про продуктивність:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Контекстне вікно: 256K токенів
Апаратні вимоги:
- Запускайте gpt-oss-20b на RTX 5090.
- Запускайте gpt-oss-120b на 4x H100.
Ви можете використовувати LoRA та QLoRA для тонкого налаштування. Підтримка ollama, LM Studio та vLLM з'явиться протягом 24 годин.
OpenAI відповідає на конкуренцію з боку Meta, Anthropic та DeepSeek. На ринку моделей з відкритими вагами з'явився новий лідер.
Додаткова спільнота для навчання: https://t.me/GyaanSetuAi