DeepSeek API又降价了，输入缓存价格仅为GPT-5.5的七百分之一_科技

DeepSeek API又降价了，输入缓存价格仅为GPT-5.5的七百分之一

2026-04-27 11:08 DeepSeek

DeepSeek API又降价了，输入缓存价格仅为GPT-5.5的七百分之一23

4月26日晚间，DeepSeek官网宣布全系API服务输入缓存命中价格降至原有价格的十分之一。Pro模型在2026年5月5日前叠加2.5折限时优惠。

这是DeepSeek连续第二日调整API价格，前一日该平台刚刚宣布V4-Pro模型API限时2.5折降价。

最新调价后，面向高速与低成本场景的DeepSeek-V4-Flash每百万tokens输入缓存命中价格为0.02元。

面向企业级用户的DeepSeek-V4-Pro输入缓存命中价格为0.1元/百万Tokens，叠加2.5折限时特惠后实际降至0.025元/百万Tokens，缓存未命中输入从12元降至3元，输出从24元降至6元。

对比调价前后，高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用，可直接实现商用成本断崖式下跌。

DeepSeek-V4预览版于4月24日正式发布并同步开源，号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。发布次日调用量已有明显增长。

数据显示，4月25日DeepSeek V4-Pro在OpenRouter上的调用量达到136亿Token，较前一日增长近四倍。

新模型两款版本均支持100万token超长上下文，Pro版单token算力仅为V3.2的27%，KV缓存降至10%，从底层实现成本优化。

一个值得关注的时间点是，4月23日OpenAI刚刚发布新一代旗舰模型GPT-5.5 Pro，API定价为每百万Token输入30美元、输出180美元，批量处理和弹性定价享受半价优惠。

26日消息显示，DeepSeek-V4-Pro叠加限时优惠后的缓存输入价仅为GPT-5.5Pro的七百分之一。

降价公告发布的同时，DeepSeek-V4完成了对华为昇腾NPU的正式适配，成为首个在官方技术文档中明确认证支持国产AI芯片的万亿参数级大模型。

DeepSeek-V4的技术报告将细粒度专家并行（EP）方案同时在英伟达GPU和华为昇腾NPU上完成验证。

价格下调和昇腾950超节点批量上市同步，业内认为这显示出DeepSeek-V4或与国产算力芯片做针对性的深度联动适配。

上海财经大学特聘教授胡延平表示，DeepSeek此举意在延揽更多用户，尤其是企业用户、开发者和各类Agent用户。

近几个月国际国内主要模型服务的资费都有较大幅度上涨，DeepSeek在资费方面再次压低行业价格预期。

在OpenAI涨价、Anthropic转向按算力计费、谷歌推出多档位按需定价的行业背景下，DeepSeek选择了另一条路。

不过，DeepSeek方面此前已在V4发布时以注释小字说明：受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，价格还会继续下探。

这意味着，0.025元/百万Tokens未必是这条降价曲线的终点。

［本文作者i黑马，i黑马原创。如需转载请联系微信公众号（ID:iheima）授权，未经授权，转载必究。］