𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝘃𝗶𝘁𝗵𝗶 𝗺𝗮𝗶̀ 𝗶𝗻 𝗸𝗮𝗻 𝗷𝗮𝗱 𝗸𝗮̀𝗿 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁
MiniMax M3 คือโมเดล multimodal ใหม่จากเซี่ยงไฮ้ มาพร้อมกับ context window ขนาด 1 ล้านโทเคน โดยปกติแล้วโมเดลส่วนใหญ่จะทำงานช้าลงและมีราคาแพงขึ้นเมื่อต้องจัดการกับความยาวระดับนี้ แต่ MiniMax M3 ใช้เทคนิคใหม่ที่เรียกว่า MiniMax Sparse Attention (MSA) เพื่อแก้ปัญหานี้
การทำงานของ MSA:
• Index branch: การประมวลผลแบบรวดเร็วเพื่อค้นหาส่วนที่เกี่ยวข้องที่สุดของข้อมูล • Sparse branch: โมเดลจะพิจารณาเฉพาะส่วนที่ระบุไว้เท่านั้น • Memory efficiency: มีการจัดกลุ่มคำสั่ง (queries) เข้าด้วยกันเพื่อป้องกันปัญหาคอขวดของหน่วยความจำ GPU
สิ่งนี้ทำให้โมเดลประมวลผลข้อมูลได้เร็วขึ้น 9 เท่า และสร้างข้อความได้เร็วขึ้น 15 เท่า เมื่อเทียบกับเวอร์ชันก่อนหน้า
คะแนนประสิทธิภาพ:
• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%
คะแนน SWE-Bench Pro นั้นสูงกว่า GPT-5.5 และ Gemini 3.1 Pro อย่างไรก็ตาม Claude Opus 4.8 ยังคงเป็นผู้นำด้วยคะแนน 69.2% ทั้งนี้ควรทราบว่า MiniMax ทำการทดสอบเหล่านี้บนฮาร์ดแวร์ของตนเอง
รายละเอียดทางเทคนิค:
M3 ถูกฝึกฝนด้วยข้อความ รูปภาพ และวิดีโอไปพร้อมกัน สามารถสั่งการคอมพิวเตอร์เดสก์ท็อปได้ และในการทดสอบ มันสามารถปรับแต่ง (optimize) CUDA kernel บนฮาร์ดแวร์ NVIDIA ได้
คุณสามารถใช้งาน M3 ได้ 3 วิธี:
- MiniMax Platform API: ใช้งานร่วมกับโค้ด OpenAI เดิมที่มีอยู่ได้ทันที
- OpenRouter: เหมาะสำหรับผู้ที่ไม่ต้องการสมัครบัญชี MiniMax โดยตรง
- Self-hosting: จำเป็นต้องมีการรองรับสถาปัตยกรรม MSA ผ่าน vLLM หรือ SGLang
ราคา:
ค่าใช้จ่ายอยู่ที่ $0.60 ต่อหนึ่งล้าน input tokens และ $2.40 ต่อหนึ่งล้าน output tokens โดยมีส่วนลดช่วงเปิดตัวที่ช่วยลดราคาลงเหลือ $0.30 และ $1.20 ซึ่งถูกกว่า Claude Opus มาก
3 สิ่งที่ควรจำ:
- Context ไม่ใช่หน่วยความจำ คุณยังคงต้องใช้หน่วยความจำภายนอกสำหรับงานของ Agent ในระยะยาว
- ตรวจสอบ Benchmark ควร รอผลการทดสอบจากบุคคลที่สามก่อนที่จะเปลี่ยนระบบทั้งหมดของคุณ
- ความเป็นส่วนตัวของข้อมูล เนื่องจาก MiniMax มีฐานอยู่ในเซี่ยงไฮ้ ควรพิจารณาเรื่องนี้หากคุณต้องจัดการกับข้อมูลที่ละเอียดอ่อน
ชุมชนเพื่อการเรียนรู้เพิ่มเติม: https://t.me/GyaanSetuAi