阿里通义千问发布小尺寸模型Qwen3-4B
阿里通义千问8月7日宣布,其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano,并在性能上接近中等规模的Qwen3-30B-A3B(non-thinking)。在推理领域,Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B(thinking)相媲美。官方指出,2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署,这将使得手机等移动设备能够高效地运行这些模型。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]