腾讯云DeepSeek-V4系列大幅降价，最高降幅97.5%_科技

腾讯云DeepSeek-V4系列大幅降价，最高降幅97.5%

2026-06-03 11:41 腾讯云

腾讯云DeepSeek-V4系列大幅降价，最高降幅97.5%23

6月2日，腾讯云发布调价公告，宣布自次日起对DeepSeek-V4系列模型的API调用价格进行下调，最高降幅达到97.5%，模型服务能力保持不变。该调价消息一出迅速引发市场关注，腾讯控股当日港股收盘大涨10.46%。

此次降价覆盖了DeepSeek-V4系列两个版本共计三个计费维度。针对定位更强的V4-Pro版本，推理输入价格由0.012元/千tokens降至0.003元/千tokens，推理输出由0.024元/千tokens降至0.006元/千tokens，两个维度的降幅均为75%。

缓存命中价格从0.001元/千tokens调至0.000025元/千tokens，降幅高达97.5%。面向轻量场景的V4-Flash版本则只下调了缓存命中费用，从0.0002元/千tokens降至0.00002元/千tokens，降幅达90%。

DeepSeek-V4系列于2026年4月24日上线，包含Pro与Flash两个版本，整体参数规模达到1.6万亿，采用混合专家架构，原生支持百万级上下文长度。

此前DeepSeek官方已于5月22日宣布将V4-Pro模型的API价格从限时优惠转为永久降价策略，本次腾讯云进一步在云服务平台层面下调了API调用定价。

DeepSeek的这轮降价并非行业内的孤立事件。5月22日，DeepSeek官方率先将V4-Pro的2.5折优惠转为永久降价，小米于5月27日宣布MiMo-V2.5系列API永久降价，最高降幅99%，新版API价格直接对标DeepSeek。

从行业竞争格局来看，通用大模型API价格的分化趋势日益明显。据智东西统计，截至2026年5月21日，阿里云百炼平台Qwen3.6-Plus输入价格为0.8元/百万tokens，输出价格2.4元/百万tokens；百度文心一言4.5 Turbo输入输出分别为0.8元和2.4元/百万tokens。

相比之下，DeepSeek-V4-Pro调整后输入价格仅3元/百万tokens，输出6元/百万tokens，在同等性能水平下价格竞争力相当突出。

降价虽利好开发者，但也需注意到市场深层矛盾并未缓解。据中国信通院数据，国内大模型API平均价格较2023年已累计下降超过90%，模型性能同期提升了3至5倍。

降价带来的AI普惠本意虽好，但行业内已有企业因无限降价换流量而陷入运营困境。有分析人士指出，若下半年调用量继续攀升，坚守低价的厂商是否有足够资源接住压力，仍是悬而未决的问题。

另外，国内大模型市场正在加速分化，有技术底气的玩家可以越卖越便宜，而积累不足的厂商即便跟进，也可能越亏越深。

当前国内大模型行业正面临一个矛盾局面。一方面，算力成本因HBM内存、GPU租赁和电力价格上涨持续高企。另一方面，各大厂商却不断压低通用大模型的API报价。

与此同时，C端应用层面，字节豆包即将推出标准版、加强版、专业版三档付费订阅，连续包月价格分别为68元、200元和500元。阿里云也推出了通义千问系列大模型的节省计划，用户通过承诺月消费金额可享受折扣。

一面是底层通用模型降价，一面是应用层服务收费，大模型商业化的两极分化趋势正在成为现实。

从行业趋势来看，2026年大模型市场正在从早期靠补贴拉新、以低价换市场规模的粗放阶段，转向以技术降本驱动的持续竞争。

通⽤大模型的竞争正从纯粹的Token价格战，逐步升级为在特定场景下推理精度、响应速度、数据安全和端到端解决问题能力的综合较量。

随着底层通用API价格持续下降，基础模型正逐渐成为像水电一样的基础设施，单纯靠卖Token赚钱的空间将被极度压缩。这场价格战的终点或许不是免费，而是AI商业模式的重新分工。

［本文作者i黑马，i黑马原创。如需转载请联系微信公众号（ID:iheima）授权，未经授权，转载必究。］