OpenAI випускає моделі з відкритими вагами

OpenAI випустила моделі з відкритими вагами. Сем Альтман анонсував gpt-oss-120b та gpt-oss-20b. Це перший випадок з 2019 року, коли OpenAI випустила ваги для завантаження.

Ці моделі використовують ліцензії типу Apache 2.0. Ви не маєте жодних обмежень щодо використання.

Деталі моделей:

  • gpt-oss-120b: 120B dense. Використовуйте її для міркувань, програмування та агентів.
  • gpt-oss-20b: 20B dense. Використовуйте її для завдань на пристроях або завдань, чутливих до вартості.

Дані про продуктивність:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Контекстне вікно: 256K токенів

Апаратні вимоги:

  • Запускайте gpt-oss-20b на RTX 5090.
  • Запускайте gpt-oss-120b на 4x H100.

Ви можете використовувати LoRA та QLoRA для тонкого налаштування. Підтримка ollama, LM Studio та vLLM з'явиться протягом 24 годин.

OpenAI відповідає на конкуренцію з боку Meta, Anthropic та DeepSeek. На ринку моделей з відкритими вагами з'явився новий лідер.

Джерело: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi