𝗢𝗽𝗲𝗻𝗔𝗜 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗢𝗽𝗲𝗻-𝗪𝗲𝗶𝗴𝗵𝘁 𝗠𝗼𝗱𝗲𝗹𝘀
OpenAI merilis model open-weight. Sam Altman mengumumkan gpt-oss-120b dan gpt-oss-20b. Ini adalah pertama kalinya OpenAI merilis bobot (weights) yang dapat diunduh sejak 2019.
Model-model ini menggunakan lisensi bergaya Apache 2.0. Anda tidak memiliki batasan dalam penggunaannya.
Detail model:
- gpt-oss-120b: 120B dense. Gunakan ini untuk penalaran, coding, dan agen.
- gpt-oss-20b: 20B dense. Gunakan ini untuk tugas pada perangkat (on-device) atau tugas yang sensitif terhadap biaya.
Data performa:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Context window: 256K token
Kebutuhan perangkat keras:
- Jalankan gpt-oss-20b pada RTX 5090.
- Jalankan gpt-oss-120b pada 4x H100.
Anda dapat menggunakan LoRA dan QLoRA untuk fine-tuning. Dukungan untuk ollama, LM Studio, dan vLLM akan hadir dalam waktu 24 jam.
OpenAI menanggapi persaingan dari Meta, Anthropic, dan DeepSeek. Pasar open-weight kini memiliki pemimpin baru.
Komunitas belajar opsional: https://t.me/GyaanSetuAi