OpenAI Phát hành các Mô hình Trọng số Mở

OpenAI đã phát hành các mô hình trọng số mở. Sam Altman đã công bố gpt-oss-120b và gpt-oss-20b. Đây là lần đầu tiên OpenAI phát hành các trọng số có thể tải xuống kể từ năm 2019.

Các mô hình này sử dụng giấy phép kiểu Apache 2.0. Bạn không bị giới hạn về việc sử dụng.

Chi tiết mô hình:

  • gpt-oss-120b: 120B dense. Sử dụng mô hình này cho lập luận, lập trình và các tác vụ agent.
  • gpt-oss-20b: 20B dense. Sử dụng mô hình này cho các tác vụ trên thiết bị hoặc các tác vụ nhạy cảm về chi phí.

Dữ liệu hiệu suất:

  • MMLU: 89.7%
  • HumanEval: 92.4%
  • SWE-bench: 63.2%
  • Cửa sổ ngữ cảnh: 256K tokens

Yêu cầu phần cứng:

  • Chạy gpt-oss-20b trên một chiếc RTX 5090.
  • Chạy gpt-oss-120b trên 4x H100.

Bạn có thể sử dụng LoRA và QLoRA để tinh chỉnh (fine-tuning). Việc hỗ trợ cho ollama, LM Studio và vLLM sẽ có trong vòng 24 giờ tới.

OpenAI đang đáp trả sự cạnh tranh từ Meta, Anthropic và DeepSeek. Thị trường trọng số mở đã có một người dẫn đầu mới.

Nguồn: https://dev.to/doremonai/openais-gpt-oss-the-moment-they-finally-went-open-weight-with-120b-and-20b-models-5g4m

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi