阿里发布多模态智能体模型Qwen3.7-Plus
阿里巴巴今日凌晨正式发布最新多模态模型Qwen3.7-Plus,定位为将视觉与语言能力统一整合的智能体基座,在 Qwen3.7 文本能力的基础上全面扩展视觉-语言能力。在性能表现方面,阿里称 Qwen3.7-Plus 在全球视觉模型榜单 Vision Arena 中跻身全球前五、中国第一。
纯文本能力方面,该模型在编码智能体基准Terminal Bench 2.0、SWE-bench 系列和 SciCode 上表现强劲,在推理基准 GPQA Diamond、HMMT 和 IMOAnswerBench 上位于 Plus 级别模型前列,整体接近 Max 级别模型水准。
多模态方面,模型在ScreenSpot Pro、OSWorld-Verified 和 AndroidWorld 等 GUI 智能体评测上相比前代有显著提升,在 VideoMMMU、MLVU 等视频理解任务和多项驾驶场景基准上也有对应增强。
[本文为作者独立观点,不代表i黑马立场。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]



