𝗢𝗽𝗲𝗻𝗔𝗜 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗢𝗽𝗲𝗻-𝗪𝗲𝗶𝗴𝗵𝘁 𝗠𝗼𝗱𝗲𝗹𝘀

OpenAI merilis model open-weight. Sam Altman mengumumkan gpt-oss-120b dan gpt-oss-20b. Ini adalah pertama kalinya OpenAI merilis bobot (weights) yang dapat diunduh sejak 2019.

Model-model ini menggunakan lisensi bergaya Apache 2.0. Anda tidak memiliki batasan dalam penggunaannya.

Detail model:

  • gpt-oss-120b: 120B dense. Gunakan ini untuk penalaran, coding, dan agen.
  • gpt-oss-20b: 20B dense. Gunakan ini untuk tugas pada perangkat (on-device) atau tugas yang sensitif terhadap biaya.

Data performa:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Context window: 256K token

Kebutuhan perangkat keras:

  • Jalankan gpt-oss-20b pada RTX 5090.
  • Jalankan gpt-oss-120b pada 4x H100.

Anda dapat menggunakan LoRA dan QLoRA untuk fine-tuning. Dukungan untuk ollama, LM Studio, dan vLLM akan hadir dalam waktu 24 jam.

OpenAI menanggapi persaingan dari Meta, Anthropic, dan DeepSeek. Pasar open-weight kini memiliki pemimpin baru.

Sumber: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Komunitas belajar opsional: https://t.me/GyaanSetuAi