阿里发布多模态智能体模型Qwen3.7-Plus
2026-06-02 09:34 阿里

阿里巴巴今日凌晨正式发布最新多模态模型Qwen3.7-Plus,定位为将视觉与语言能力统一整合的智能体基座,在 Qwen3.7 文本能力的基础上全面扩展视觉-语言能力。在性能表现方面,阿里称 Qwen3.7-Plus 在全球视觉模型榜单 Vision Arena 中跻身全球前五、中国第一。

纯文本能力方面,该模型在编码智能体基准Terminal Bench 2.0、SWE-bench 系列和 SciCode 上表现强劲,在推理基准 GPQA Diamond、HMMT 和 IMOAnswerBench 上位于 Plus 级别模型前列,整体接近 Max 级别模型水准。

多模态方面,模型在ScreenSpot Pro、OSWorld-Verified 和 AndroidWorld 等 GUI 智能体评测上相比前代有显著提升,在 VideoMMMU、MLVU 等视频理解任务和多项驾驶场景基准上也有对应增强。

88.jpg