MiniMax M3 发布,支持 100 万上下文
MiniMax 官方昨日发布 MiniMax M3。官方称,M3 同时具备 Coding、100 万 token 上下文和原生多模态三项能力,API 支持最高 100 万 token 上下文窗口,并保证至少 512K token。
M3 的核心架构是 MiniMax Sparse Attention。官方介绍称,MSA 通过稀疏注意力和 KV 分块降低长上下文计算成本,在 100 万上下文下,每 token 计算量约为上代模型的 1/20,prefilling 阶段加速超过 9 倍,decoding 阶段加速超过 15 倍。模型能力方面,官方给出的基准包括 SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8%、MCP Atlas 74.2%。
[本文为作者独立观点,不代表i黑马立场。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]



