OpenAI نے اوپن ویٹ (Open-Weight) ماڈلز جاری کر دیے ہیں
OpenAI نے اوپن ویٹ ماڈلز جاری کر دیے ہیں۔ Sam Altman نے gpt-oss-120b اور gpt-oss-20b کا اعلان کیا ہے۔ 2019 کے بعد یہ پہلا موقع ہے کہ OpenAI نے ڈاؤن لوڈ کے قابل ویٹس (weights) جاری کیے ہیں۔
یہ ماڈلز Apache 2.0 طرز کے لائسنس استعمال کرتے ہیں۔ آپ کے استعمال پر کوئی پابندی نہیں ہے۔
ماڈل کی تفصیلات:
- gpt-oss-120b: 120B dense۔ اسے reasoning، coding، اور agents کے لیے استعمال کریں۔
- gpt-oss-20b: 20B dense۔ اسے on-device یا کم لاگت والے کاموں کے لیے استعمال کریں۔
کارکردگی کا ڈیٹا:
- MMLU: 89.7%
- HumanEval: 92.4%
- SWE-bench: 63.2%
- Context window: 256K tokens
ہارڈ ویئر کی ضروریات:
- gpt-oss-20b کو RTX 5090 پر چلائیں۔
- gpt-oss-120b کو 4x H100s پر چلائیں۔
آپ fine-tuning کے لیے LoRA اور QLoRA استعمال کر سکتے ہیں۔ ollama، LM Studio، اور vLLM کے لیے سپورٹ 24 گھنٹوں کے اندر دستیاب ہو جائے گی۔
OpenAI، Meta، Anthropic، اور DeepSeek کے مقابلے کا جواب دے رہا ہے۔ اوپن ویٹ مارکیٹ میں ایک نیا لیڈر آ گیا ہے۔
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi