𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝘃𝗶𝘁𝗵𝗶 𝗺𝗮𝗶̀ 𝗶𝗻 𝗸𝗮𝗻 𝗷𝗮𝗱 𝗸𝗮̀𝗿 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

MiniMax M3 คือโมเดล multimodal ใหม่จากเซี่ยงไฮ้ มาพร้อมกับ context window ขนาด 1 ล้านโทเคน โดยปกติแล้วโมเดลส่วนใหญ่จะทำงานช้าลงและมีราคาแพงขึ้นเมื่อต้องจัดการกับความยาวระดับนี้ แต่ MiniMax M3 ใช้เทคนิคใหม่ที่เรียกว่า MiniMax Sparse Attention (MSA) เพื่อแก้ปัญหานี้

การทำงานของ MSA:

• Index branch: การประมวลผลแบบรวดเร็วเพื่อค้นหาส่วนที่เกี่ยวข้องที่สุดของข้อมูล • Sparse branch: โมเดลจะพิจารณาเฉพาะส่วนที่ระบุไว้เท่านั้น • Memory efficiency: มีการจัดกลุ่มคำสั่ง (queries) เข้าด้วยกันเพื่อป้องกันปัญหาคอขวดของหน่วยความจำ GPU

สิ่งนี้ทำให้โมเดลประมวลผลข้อมูลได้เร็วขึ้น 9 เท่า และสร้างข้อความได้เร็วขึ้น 15 เท่า เมื่อเทียบกับเวอร์ชันก่อนหน้า

คะแนนประสิทธิภาพ:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

คะแนน SWE-Bench Pro นั้นสูงกว่า GPT-5.5 และ Gemini 3.1 Pro อย่างไรก็ตาม Claude Opus 4.8 ยังคงเป็นผู้นำด้วยคะแนน 69.2% ทั้งนี้ควรทราบว่า MiniMax ทำการทดสอบเหล่านี้บนฮาร์ดแวร์ของตนเอง

รายละเอียดทางเทคนิค:

M3 ถูกฝึกฝนด้วยข้อความ รูปภาพ และวิดีโอไปพร้อมกัน สามารถสั่งการคอมพิวเตอร์เดสก์ท็อปได้ และในการทดสอบ มันสามารถปรับแต่ง (optimize) CUDA kernel บนฮาร์ดแวร์ NVIDIA ได้

คุณสามารถใช้งาน M3 ได้ 3 วิธี:

  • MiniMax Platform API: ใช้งานร่วมกับโค้ด OpenAI เดิมที่มีอยู่ได้ทันที
  • OpenRouter: เหมาะสำหรับผู้ที่ไม่ต้องการสมัครบัญชี MiniMax โดยตรง
  • Self-hosting: จำเป็นต้องมีการรองรับสถาปัตยกรรม MSA ผ่าน vLLM หรือ SGLang

ราคา:

ค่าใช้จ่ายอยู่ที่ $0.60 ต่อหนึ่งล้าน input tokens และ $2.40 ต่อหนึ่งล้าน output tokens โดยมีส่วนลดช่วงเปิดตัวที่ช่วยลดราคาลงเหลือ $0.30 และ $1.20 ซึ่งถูกกว่า Claude Opus มาก

3 สิ่งที่ควรจำ:

  • Context ไม่ใช่หน่วยความจำ คุณยังคงต้องใช้หน่วยความจำภายนอกสำหรับงานของ Agent ในระยะยาว
  • ตรวจสอบ Benchmark ควร รอผลการทดสอบจากบุคคลที่สามก่อนที่จะเปลี่ยนระบบทั้งหมดของคุณ
  • ความเป็นส่วนตัวของข้อมูล เนื่องจาก MiniMax มีฐานอยู่ในเซี่ยงไฮ้ ควรพิจารณาเรื่องนี้หากคุณต้องจัดการกับข้อมูลที่ละเอียดอ่อน

แหล่งที่มา: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

ชุมชนเพื่อการเรียนรู้เพิ่มเติม: https://t.me/GyaanSetuAi