最新消息显示,DeepSeek 最新“王炸”模型 —— DeepSeek-V4,近期或将问世。
其实早在1月9日,就有知情人士称,DeepSeek 或将于2月中旬,即春节前后发布其下一代模型。
据说,该模型将主打编程能力,且在内部测试中已经在多个基准上超越了Claude与GPT系列。
今天,有细心的网友发现,DeepSeek向其核心推理内核FlashMLA推送了一系列更新,其中,一个名为“Model1”的模型引起了网友的广泛关注。
而且,这个神秘的 “Model1”, 不仅出现在了代码与注释中,甚至还有与 DeepSeek-V3.2 并驾齐驱的文件。
所以,有网友推断, Model1 ,可能是 DeepSeek 下一代旗舰模型 ——DeepSeek-V4 的内部开发代号或首个工程版本。
有海外开发者推测,MODEL1的背后将是一整套新的推理机制、算子结构与底层内存配置,会与DeepSeek现有V3.2模型呈现出完全不同的技术路径。
甚至,在更多技术大佬通过“侦查”更多代码细节,得出的所有结论几乎都指向一个点:
MODEL1很可能已接近训练完成或推理部署阶段,正等待最终的权重冻结和测试验证。
就在昨天,全球最大的 AI 开源社区 Hugging Face,刚发布了他们中国开源系列的首篇文章:“DeepSeek 时刻”一周年。
文中提到,2025 年,是属于中国开源 AI 的“DeepSeek 时刻”。
因为 DeepSeek 发布的R1模型,至少帮我们扫清了三个“障碍”:
第一,技术门槛:公开推理路径,把“推理”变成了人人可用的工程模块。第二,应用门槛:MIT 协议一出,直接商用,大家不再卷跑分,开始卷落地。第三,心理门槛:中国开发者的“心魔”破了。 我们不再问“能不能做?”,而是开始问“怎么做得比别人好?”。
而DeepSeek 发布的R1模型的巨大影响,远不止于此。
创业黑马集团创始人、董事长牛文文此前称,春节期间的 DeepSeek 狂潮,还让全世界都意识到,中国资产被严重低估。于是,这些投资人开始在香港资本市场寻找有潜力的中国资产。
这正好让蜜雪冰城、沪上阿姨、鸣鸣很忙、霸王茶姬等中国新消费公司,借助中国资产重构的大浪潮,开始去港股扎堆上市。
谁都没想到, AI 的破圈,第一批受益者竟然是新消费创业公司。
此外,金沙江创投主管合伙人、黑马导师朱啸虎也认为,DeepSeek 出来后,只有中美两个国家有机会在 AI 领域展开最终角逐。所以,大家觉得中国资产现在明显是被低估的。
美国股市虽然涨得还是很好,但包括美国投资人在内的很多投资大佬都觉得,美国的资产比较贵,而且基本都集中在AI领域。
相对来说,中国资产在去年底和今年初要便宜很多。尽管涨上来一些,但还是比美国便宜。所以,全球投资人都开始重视中国资产。
现在 DeepSeek-V4 还未正式问世,已引发全球关注者的提前狂欢。
那么,DeepSeek-V4 还会像1年前那样,在春节期间给全世界一个“超级 surprise”吗?如果 DeepSeek-V4 正式问世,又将给全球AI领域和中国经济带来哪些蝴蝶效应?
最后,让我们准备好再次见证历史吧。



