DeepSeek API又降价了,输入缓存价格仅为GPT-5.5的七百分之一
2026-04-27 11:08 DeepSeek

DeepSeek API又降价了,输入缓存价格仅为GPT-5.5的七百分之一23

4月26日晚间,DeepSeek官网宣布全系API服务输入缓存命中价格降至原有价格的十分之一。Pro模型在2026年5月5日前叠加2.5折限时优惠。

这是DeepSeek连续第二日调整API价格,前一日该平台刚刚宣布V4-Pro模型API限时2.5折降价。

最新调价后,面向高速与低成本场景的DeepSeek-V4-Flash每百万tokens输入缓存命中价格为0.02元。

面向企业级用户的DeepSeek-V4-Pro输入缓存命中价格为0.1元/百万Tokens,叠加2.5折限时特惠后实际降至0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。

对比调价前后,高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌。

DeepSeek-V4预览版于4月24日正式发布并同步开源,号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。发布次日调用量已有明显增长。

数据显示,4月25日DeepSeek V4-Pro在OpenRouter上的调用量达到136亿Token,较前一日增长近四倍。

新模型两款版本均支持100万token超长上下文,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。

一个值得关注的时间点是,4月23日OpenAI刚刚发布新一代旗舰模型GPT-5.5 Pro,API定价为每百万Token输入30美元、输出180美元,批量处理和弹性定价享受半价优惠。

26日消息显示,DeepSeek-V4-Pro叠加限时优惠后的缓存输入价仅为GPT-5.5Pro的七百分之一。

降价公告发布的同时,DeepSeek-V4完成了对华为昇腾NPU的正式适配,成为首个在官方技术文档中明确认证支持国产AI芯片的万亿参数级大模型。

DeepSeek-V4的技术报告将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。

价格下调和昇腾950超节点批量上市同步,业内认为这显示出DeepSeek-V4或与国产算力芯片做针对性的深度联动适配。

上海财经大学特聘教授胡延平表示,DeepSeek此举意在延揽更多用户,尤其是企业用户、开发者和各类Agent用户。

近几个月国际国内主要模型服务的资费都有较大幅度上涨,DeepSeek在资费方面再次压低行业价格预期。

在OpenAI涨价、Anthropic转向按算力计费、谷歌推出多档位按需定价的行业背景下,DeepSeek选择了另一条路。

不过,DeepSeek方面此前已在V4发布时以注释小字说明:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,价格还会继续下探。

这意味着,0.025元/百万Tokens未必是这条降价曲线的终点。

88.jpg