阶跃星辰开源Step 3.7 Flash大模型 ,推动Agent向企业生产级演进
2026-05-29 18:41 阶跃星辰

阶跃星辰开源Step 3.7 Flash大模型 ,推动Agent向企业生产级演进23

5月29日,基础大模型创业公司阶跃星辰正式发布并开源Step 3.7 Flash模型。这款面向生产级Agent场景设计的Flash模型,采用稀疏混合专家架构,总参数为1960亿,配备18.8亿参数的视觉编码器ViT,激活参数仅为110亿,最高生成速度可达每秒400个Token。

模型支持25.6万Token上下文长度,提供三种推理层级,主要面向高频、多轮、低延迟的智能体应用场景。

与今年2月开源的Step 3.5 Flash相比,3.7版本在Agent能力上进行了系统性强化。模型重点优化了四个关键能力:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排以及Agent生态兼容性。

Step 3.7 Flash能够直接处理UI界面、图表、文档、图片以及各类应用界面,将复杂视觉信息转化为结构化结果和可执行任务,并在信息不确定时主动发起搜索进行交叉验证。工具调用方面,模型可在长程多轮工作流中稳定调用API、浏览器、终端、Office等外部系统。

基准测试方面,Step 3.7 Flash在ClawEval 1.1自主任务执行评测中得分67.1%,在考察多工具协同的Toolathlon上得分49.5%,在横跨44种职业的GDPval上得分45.8%,在τ²-bench Telecom全难度通信任务测试中通过率均超过98%。

在代码与工程能力上,模型在SimpleVQA Search视觉问答任务中得分79.2%,在V* Python视觉编程任务中得分95.3%,在SWE-Bench Pro软件工程评测中得分56.3%,位列全球第二。

需注意的是,这些数据均由阶跃星辰官方披露,尚未经由独立第三方机构横向验证。

开源生态方面,Step 3.7 Flash采用Apache 2.0开源协议,已在Hugging Face和ModelScope平台上线,权重和代码均可直接下载。

模型对Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流开发框架和工具调用协议进行了兼容优化,同时支持云端与本地部署。

在硬件适配层面,该模型可在Mac Studio M4 Max、DGX Spark以及AMD AI Max+395等本地设备上运行。

当前开源大模型领域竞争格局已较为激烈。2026年4月,DeepSeek发布了V4系列,包含旗舰版V4-Pro与轻量版V4-Flash,总参数分别达到1.6万亿和2840亿,均支持百万Token上下文,采用MIT开源协议。

2月,阿里开源了Qwen3.5-Plus,总参数3970亿,激活170亿参数,部署显存占用较前代降低60%。4月,腾讯混元发布Hy3 preview并同步开源,同期还有月之暗面Kimi K2.6和智谱GLM-5.1相继发布。

Step 3.7 Flash在参数规模上处于竞品序列的中等水平,其核心差异在于明确聚焦Agent场景的工程化优化而非纯参数竞赛。模型在工具调用和任务执行方面的针对性设计,使其在特定Agent工作流中具备差异化竞争力,但在通用推理能力和极致性能上尚需更多第三方评测验证。

从行业趋势看,国产大模型开源已形成密集迭代态势。截至2025年12月,国产开源大模型全球累计下载量突破100亿次。斯坦福大学2026年3月发布的AI指数报告显示,先进闭源模型的整体表现仅比顶尖开源模型领先3.3个百分点。

OpenRouter平台的用户数据显示,Step 3.5 Flash上线一个月后曾登顶该平台OpenClaw调用量月榜全球第一,说明市场对高效Agent模型存在真实需求。

Step 3.7 Flash能否延续这一趋势,将取决于其在实际部署中的稳定性、社区采纳速度以及后续第三方独立评测的反馈。

88.jpg