6月2日,腾讯云发布调价公告,宣布自次日起对DeepSeek-V4系列模型的API调用价格进行下调,最高降幅达到97.5%,模型服务能力保持不变。该调价消息一出迅速引发市场关注,腾讯控股当日港股收盘大涨10.46%。
此次降价覆盖了DeepSeek-V4系列两个版本共计三个计费维度。针对定位更强的V4-Pro版本,推理输入价格由0.012元/千tokens降至0.003元/千tokens,推理输出由0.024元/千tokens降至0.006元/千tokens,两个维度的降幅均为75%。
缓存命中价格从0.001元/千tokens调至0.000025元/千tokens,降幅高达97.5%。面向轻量场景的V4-Flash版本则只下调了缓存命中费用,从0.0002元/千tokens降至0.00002元/千tokens,降幅达90%。
DeepSeek-V4系列于2026年4月24日上线,包含Pro与Flash两个版本,整体参数规模达到1.6万亿,采用混合专家架构,原生支持百万级上下文长度。
此前DeepSeek官方已于5月22日宣布将V4-Pro模型的API价格从限时优惠转为永久降价策略,本次腾讯云进一步在云服务平台层面下调了API调用定价。
DeepSeek的这轮降价并非行业内的孤立事件。5月22日,DeepSeek官方率先将V4-Pro的2.5折优惠转为永久降价,小米于5月27日宣布MiMo-V2.5系列API永久降价,最高降幅99%,新版API价格直接对标DeepSeek。
从行业竞争格局来看,通用大模型API价格的分化趋势日益明显。据智东西统计,截至2026年5月21日,阿里云百炼平台Qwen3.6-Plus输入价格为0.8元/百万tokens,输出价格2.4元/百万tokens;百度文心一言4.5 Turbo输入输出分别为0.8元和2.4元/百万tokens。
相比之下,DeepSeek-V4-Pro调整后输入价格仅3元/百万tokens,输出6元/百万tokens,在同等性能水平下价格竞争力相当突出。
降价虽利好开发者,但也需注意到市场深层矛盾并未缓解。据中国信通院数据,国内大模型API平均价格较2023年已累计下降超过90%,模型性能同期提升了3至5倍。
降价带来的AI普惠本意虽好,但行业内已有企业因无限降价换流量而陷入运营困境。有分析人士指出,若下半年调用量继续攀升,坚守低价的厂商是否有足够资源接住压力,仍是悬而未决的问题。
另外,国内大模型市场正在加速分化,有技术底气的玩家可以越卖越便宜,而积累不足的厂商即便跟进,也可能越亏越深。
当前国内大模型行业正面临一个矛盾局面。一方面,算力成本因HBM内存、GPU租赁和电力价格上涨持续高企。另一方面,各大厂商却不断压低通用大模型的API报价。
与此同时,C端应用层面,字节豆包即将推出标准版、加强版、专业版三档付费订阅,连续包月价格分别为68元、200元和500元。阿里云也推出了通义千问系列大模型的节省计划,用户通过承诺月消费金额可享受折扣。
一面是底层通用模型降价,一面是应用层服务收费,大模型商业化的两极分化趋势正在成为现实。
从行业趋势来看,2026年大模型市场正在从早期靠补贴拉新、以低价换市场规模的粗放阶段,转向以技术降本驱动的持续竞争。
通⽤大模型的竞争正从纯粹的Token价格战,逐步升级为在特定场景下推理精度、响应速度、数据安全和端到端解决问题能力的综合较量。
随着底层通用API价格持续下降,基础模型正逐渐成为像水电一样的基础设施,单纯靠卖Token赚钱的空间将被极度压缩。这场价格战的终点或许不是免费,而是AI商业模式的重新分工。



