海光昇腾寒武纪,谁能吃下推理算力爆发的红利?
2026-03-10 16:48 寒武纪

海光昇腾寒武纪,谁能吃下推理算力爆发的红利?23

3月9日,上海人工智能实验室推出的DeepLink多元算力混合推理加速方案引发行业关注,海光信息携手该方案开展混合调度与协同推理测试的消息也随之传出。

这一事件本身并不令人意外,DeepLink此前已完成对昇腾、平头哥、沐曦、天数智芯、寒武纪等10余家国产算力的适配,海光的加入只是补齐了版图上的又一块拼图。

真正值得思考的问题是,当DeepLink这样的异构调度平台试图让国产芯片“心往一处想”时,各家厂商的差异化路径究竟意味着什么?

1.三条路线,三种生存逻辑

如果将国产AI芯片的主要玩家放在一起审视,可以清晰地看到三条截然不同的技术路线。

华为昇腾走的是全栈自研的道路,从昇腾910B/C系列芯片到CANN底层算子库,再到MindSpore框架,形成了一个完全自主的闭环体系。

这种模式的战略价值在于不受任何外部生态制约,昇腾384超节点可实现300PFlops集群算力,在超大规模训练场景中稳坐国产头把交椅。但代价同样明显,开发者需要适应一套全新的工具链,迁移成本不可忽视。

与昇腾形成鲜明对比的是海光信息。凭借x86指令集授权,海光形成了“C86+GPGPU”的产品矩阵,其DCU(深度计算处理器)在架构层面天然兼容x86服务器生态。

对于金融、能源等政企客户而言,这意味着能以最小的架构改动成本将国产算力嵌入现有IT基础设施。

更关键的是,海光DCU支持“类CUDA”环境,PyTorch、TensorFlow等主流框架上的业务可以实现“无感迁移”。

这种“借势”策略降低了用户入场门槛,但也意味着海光始终在别人定义的规则下游戏。

第三股力量来自寒武纪、沐曦、摩尔线程等企业。

寒武纪凭借思元590的345TFLOPS FP16算力和96GB HBM2e显存,在性能参数上紧咬英伟达A100。

沐曦的曦云C500则强调FP8精度与千卡集群能力,且其MXMACA软件栈在API层面实现对CUDA的高度兼容,已支持超过6000个CUDA应用。

摩尔线程作为“国产GPU第一股”,选择了更接近英伟达早期风格的全功能路线,用AI智算、专业图形、桌面级图形全覆盖,2024年营收4.38亿元中AI智算贡献3.36亿元,证明这条路也能走通。

2.软件栈:真正的分水岭尚未到来

如果只看硬件参数,国产芯片的进步有目共睹。但熟悉行业的人都知道,AI芯片的竞争早已不是算力指标的堆砌,而是软件栈的成熟度之争。

英伟达CUDA构筑的护城河,本质上是数百万开发者、数十年的代码积累以及从驱动到框架的完整工具链所形成的网络效应。

目前国产厂商应对生态壁垒的策略大致分为三类。

华为选择自建,用全栈能力吸引开发者“用脚投票”;海光选择兼容,让CUDA代码能以最低成本迁移运行;更多厂商则寄望于DeepLink这类异构平台,希望借助中间件屏蔽底层硬件差异。

三种路径各有拥趸,但一个不容回避的现实是,兼容模式固然能快速导入存量应用,却可能使国产平台长期停留在“生态附庸”的位置。

更值得警惕的是,若未来CUDA生态在兼容性上设置新的技术壁垒,当前这种依附式发展的可持续性将面临考验。

从DeepLink实测数据看,异构调度确实能带来实实在在的性能提升。在千卡规模推理集群中,对比单芯片方案,时延TTFT最大优化34.5%,推理吞吐最高提升32%。

但这类优化更多解决的是“能用”层面的问题,距离“好用”仍有距离。在长尾模型、科学计算等细分领域,国产芯片的软件栈优化空间依然巨大。

3.推理时代的价值重估

2026年,AI产业的重心正从训练向推理迁移。驱动这一转变的“三驾马车”已经成型:应用全面铺开带来日均50万亿Token的消耗规模,推理模型的兴起使单次调用token显著增加,Agentic AI则将推理由单次请求演变为连续过程。

对于国产芯片而言,这意味着竞争逻辑正在发生深刻变化,训练场景追求单卡算力的极致,而推理场景更看重性价比、时延和能效比。

这一变化对不同厂商意味着不同的机会窗口。

海光凭借x86兼容性,在存量信创市场占据有利身位;昇腾依托超节点能力,继续卡位超大模型训练高地;云天励飞等新玩家则押注PD分离架构,试图通过预填充和解码阶段的专用芯片设计,在推理效率上形成差异化优势。

但无论选择哪条路径,所有厂商都将面临同一个终极考验,即能否在完全市场化的场景中,让客户主动选择而非被动接受?

DeepLink混推方案的真正价值,或许不在于它能让多少款芯片协同工作,而在于它揭示了国产算力产业正在进入一个新阶段——从各自为战走向系统整合。

当异构调度成为可能,用户的算力采购逻辑将从“选哪家芯片”转向“如何组合最优”。这场竞争的下半场,比拼的不再是谁的参数更漂亮,而是谁能在软硬协同、生态兼容和成本控制之间找到那个动态平衡点。

88.jpg