阶跃星辰开源Step 3.7 Flash大模型，推动Agent向企业生产级演进_科技

阶跃星辰开源Step 3.7 Flash大模型，推动Agent向企业生产级演进

2026-05-29 18:41 阶跃星辰

阶跃星辰开源Step 3.7 Flash大模型，推动Agent向企业生产级演进23

5月29日，基础大模型创业公司阶跃星辰正式发布并开源Step 3.7 Flash模型。这款面向生产级Agent场景设计的Flash模型，采用稀疏混合专家架构，总参数为1960亿，配备18.8亿参数的视觉编码器ViT，激活参数仅为110亿，最高生成速度可达每秒400个Token。

模型支持25.6万Token上下文长度，提供三种推理层级，主要面向高频、多轮、低延迟的智能体应用场景。

与今年2月开源的Step 3.5 Flash相比，3.7版本在Agent能力上进行了系统性强化。模型重点优化了四个关键能力：原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排以及Agent生态兼容性。

Step 3.7 Flash能够直接处理UI界面、图表、文档、图片以及各类应用界面，将复杂视觉信息转化为结构化结果和可执行任务，并在信息不确定时主动发起搜索进行交叉验证。工具调用方面，模型可在长程多轮工作流中稳定调用API、浏览器、终端、Office等外部系统。

基准测试方面，Step 3.7 Flash在ClawEval 1.1自主任务执行评测中得分67.1%，在考察多工具协同的Toolathlon上得分49.5%，在横跨44种职业的GDPval上得分45.8%，在τ²-bench Telecom全难度通信任务测试中通过率均超过98%。

在代码与工程能力上，模型在SimpleVQA Search视觉问答任务中得分79.2%，在V* Python视觉编程任务中得分95.3%，在SWE-Bench Pro软件工程评测中得分56.3%，位列全球第二。

需注意的是，这些数据均由阶跃星辰官方披露，尚未经由独立第三方机构横向验证。

开源生态方面，Step 3.7 Flash采用Apache 2.0开源协议，已在Hugging Face和ModelScope平台上线，权重和代码均可直接下载。

模型对Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流开发框架和工具调用协议进行了兼容优化，同时支持云端与本地部署。

在硬件适配层面，该模型可在Mac Studio M4 Max、DGX Spark以及AMD AI Max+395等本地设备上运行。

当前开源大模型领域竞争格局已较为激烈。2026年4月，DeepSeek发布了V4系列，包含旗舰版V4-Pro与轻量版V4-Flash，总参数分别达到1.6万亿和2840亿，均支持百万Token上下文，采用MIT开源协议。

2月，阿里开源了Qwen3.5-Plus，总参数3970亿，激活170亿参数，部署显存占用较前代降低60%。4月，腾讯混元发布Hy3 preview并同步开源，同期还有月之暗面Kimi K2.6和智谱GLM-5.1相继发布。

Step 3.7 Flash在参数规模上处于竞品序列的中等水平，其核心差异在于明确聚焦Agent场景的工程化优化而非纯参数竞赛。模型在工具调用和任务执行方面的针对性设计，使其在特定Agent工作流中具备差异化竞争力，但在通用推理能力和极致性能上尚需更多第三方评测验证。

从行业趋势看，国产大模型开源已形成密集迭代态势。截至2025年12月，国产开源大模型全球累计下载量突破100亿次。斯坦福大学2026年3月发布的AI指数报告显示，先进闭源模型的整体表现仅比顶尖开源模型领先3.3个百分点。

OpenRouter平台的用户数据显示，Step 3.5 Flash上线一个月后曾登顶该平台OpenClaw调用量月榜全球第一，说明市场对高效Agent模型存在真实需求。

Step 3.7 Flash能否延续这一趋势，将取决于其在实际部署中的稳定性、社区采纳速度以及后续第三方独立评测的反馈。

［本文作者i黑马，i黑马原创。如需转载请联系微信公众号（ID:iheima）授权，未经授权，转载必究。］