MiniMax M3 发布,支持 100 万上下文
2026-06-02 09:44 MiniMax

MiniMax 官方昨日发布 MiniMax M3。官方称,M3 同时具备 Coding、100 万 token 上下文和原生多模态三项能力,API 支持最高 100 万 token 上下文窗口,并保证至少 512K token。

M3 的核心架构是 MiniMax Sparse Attention。官方介绍称,MSA 通过稀疏注意力和 KV 分块降低长上下文计算成本,在 100 万上下文下,每 token 计算量约为上代模型的 1/20,prefilling 阶段加速超过 9 倍,decoding 阶段加速超过 15 倍。模型能力方面,官方给出的基准包括 SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8%、MCP Atlas 74.2%。

88.jpg