来源:融中财经(ID:thecapital) 作者:吕敬之
MiniMax用一纸近3亿美元的新融资,把“AI六小虎”的排位赛推向高潮。
昨晚消息称,大模型公司MiniMax近3亿美元的新一轮融资已接近完成,投后估值超过40亿美元(约300亿元人民币)。结合公开信息,目前国内达到这一估值的大模型公司有MiniMax和智谱。
这家由前商汤副总裁闫俊杰于2021年创立的大模型公司,正以惊人的速度完成从“技术炫技”到“商业闭环”的跨越:一边发布覆盖基座、视频、语音、Agent的全栈产品,一边让爆款情感应用Talkie在海外狂揽千万下载,又借“蓝色胖猫”让海螺AI在卷到冒烟的视频生成赛道成功破圈。
然而,速度只是门票,真正决定终点的,是如何在“更快、更好、更赚钱”的三角难题中找到平衡。
当对话、生图、生视频的同质化军备竞赛让免费成为默认选项,DeepSeek用“展示思考过程”撕开差异化缺口;当Agent被视为2025商业化的最大变量,MiniMax推出Hailuo Video Agent,试图用一句话生成专业级短片,回答市场上关于“Agent到底解决什么具体问题”的灵魂拷问。
MiniMax收获的新融资,也在推动“AI六小虎”竞争的新叙事。
又一家“AI六小虎“融了一笔
这一局,Minimax领先了一步。
昨晚,据媒体报道,大模型公司MiniMax近3亿美元的新一轮融资已接近完成,投后估值超过40亿美元(约300亿元人民币)。结合公开信息,目前国内达到这一估值的大模型公司有MiniMax和智谱。
今年,Minimax不断传出好消息。先是产品发布。MiniMax发布了一系列核心技术与产品,涵盖基座模型、视频生成模型、多模态智能体等多个方向,系统展现其“模型—多模态—应用”一体化技术路线。
作为底层基础能力的支撑,MiniMax发布并开源了自主研发的MiniMax-M1系列模型;配套算法方面,MiniMax推出了新的CISPO强化学习优化算法;在多模态生成领域,MiniMax推出新一代视频大模型Hailuo 02,主打高保真物理模拟与直接生成1080P画质视频能力;Hailuo Video Agent则通过自然语言驱动全局、全流程工具集调用,实现“零门槛专业级视频生成”;语音模型Speech 02也进行了功能更新,Voice Design音色设计,用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制。
同时,企业也传来了IPO的消息,今年6月,彭博社报道称,MiniMax正在筹备赴港上市。
Minimax一直都是资本的宠儿。红杉中国、阿里巴巴、腾讯、IDG资本、米哈游,MiniMax汇集了产业和机构中最顶级的资本。在2024年获得6亿美元A轮融资后,估值也已经超过了25亿美元(折合人民币约179亿元)。
2021年,商汤科技前副总裁闫俊杰创立了Minimax。很长一段时间,公司最出圈的除了创始人的明星履历,还有一款海外的AI情感APP——Talkie。仅去年前8个月,Talkie的全球下载量就快速突破千万次,超过Character AI,成为美国市场下载量第4的人工智能应用。英国《金融时报》报道称,仅来自Talkie的用户付费和广告收入去年就为MiniMax创造了7000万美元的营收。
不过,从去年底开始,很多社交直播APP都被要求下架整改,这其中就包括Talkie。
这让MiniMax体会到了过渡依赖单一产品的风险,于是,2024年9月,MiniMax发布了视频生成模型“海螺视频I2V-01”,并上线海螺AI。
起初海螺AI没有被广泛认可,甚至被认为“有点过时”,毕竟AI时代人人追新,而AIGC作为GPT之后第一个火起来的赛道,在海螺AI推出来的时候已经被认为是“火过头”了。何况前有快手可灵AI后有字节Seeweed和PixelDance,海螺AI作为一个初创公司的产品当时并没有立即就被寄予厚望。
结果,一款海螺AI生成的蓝色胖猫IP爆火,也让海螺AI在AIGC中开始出圈。不少网友称,海螺AI为目前市面上最优秀的AI视频生成模型。更有网友直言,若不是注意到一些细微的瑕疵,他们几乎以为这些视频是真实拍摄的。
前不久,MiniMax也正官宣了旗下的Agent产品。融中财经也第一时间体验了这个产品。
进入页面之后,会出现“chat”和“Agent”两个选项,我们先选择“chat”,询问“介绍一下MiniMax,包括产品、融资和未来发展”,再把回答和元宝的输出做出对比的话,可以发现,两者的回答语言都非常流畅丝滑,没有事实性错误,或许是因为自家产品的原因,MiniMax介绍得更全面一些。
再选择Agent模式,融中财经尝试提出一个要求“分析蔚来汽车2025年第一季度的财务报表”,MiniMax接下来执行了几个任务,包括搜索数据、同行对比、数据分析等。然后直接产出了一个报告。
这份财务分析比较了同比、环比数据,也就是说Agent拆解整体任务为收集数据和分析数据两个大方面,其收集了2024第一季度、2024第四季度以及2025第一季度蔚来的数据,进行了对比。除了微观数据的分析,报告还结合当下的行业环境给了更宏观的分析和评价,作为一个初步的财务分析报告可以高效地帮助用户掌握情况。
要快,还要好
“天下武功,唯快不破”这句话应该送给所有的AI创业者。
Talkie的出圈就赢在了“快”。
上线快,2022年10月,ChatGPT爆火的前一个月,Talkie的前身,一款能直接对话的AI智能体产品Glow,就已经上线了;出海快,当时出海这个路线并没有成为AI厂一个约定俗成的玩法,Talkie就抢先一步海外上线了。
不过“快”,这一招留给AI创业者的机会已经不多了,如今市面上同质化的AI搜索、AI社交的产品层出不穷,这也让产品的差异化成了品牌的必修课。
“订阅制是一部分AI产品的商业化手段,想要用户付费,差异化就是必须的。”AI产品经理默默(化名)对融中财经表示。
现在的AI产品同质化太高了,对话、视频与图片生成这两个最普遍的赛道,就可以看到各家的大模型争先上线类似对话、搜索类的功能,或者是对话衍生的功能,这就导致很多产品严重同质化。而同质化严重就会让用户觉得选项很多,一旦一个产品开始收费,用户大可以转向免费的产品继续使用。所以同行之间的价格战,甚至在没开始变现的时候就已经打响了。
就拿对话类大模型来说,文心一言、Kimi、IMA、抖音、心流APP等产品先后上线,一直到Deepseek的出现,才又再次出圈。
而Deepseek的出圈,实际就是在用户体验上一次“差异化”创新的成功。
Deepseek展示了思考的过程,其实这并不见得是一个技术的飞跃,但却是用户体验的进步,用户看到了大模型思考的过程,有了更多交互的体验。所以在Deepseek之后很多AI产品也跟着展示了一部分思考的过程。
要够快,要够好,还要够赚钱,这就是冲刺IPO的“AI六小虎”普遍面临的问题。
商业化的不确定性一直是AI企业冲刺IPO的一道坎,这个情况在今年明显变得更乐观。2025年被视为Agent AI商业化的元年,AI Agent的应用场景不断拓展,从办公类Agent到垂直类Agent,再到更广泛的行业应用。未来式智能等企业已经在电力、金融、泛互联网、制造业等行业实现了Agent的常态化应用。例如,Glean垂直于企业知识数据库的搜索,优化企业内部数据检索和问题答复,在近两年中ARR翻倍增长。DayDream链接了超过2000+品牌,支持自然语言检索,根据用户提供的时间、地点、场合等信息给予相关产品推荐。这些应用不仅提升了企业的运营效率,还为用户带来了更便捷、高效的体验,进一步推动了Agent技术的商业化落地。
争做“超级APP”
一代人会有一代人的“超级APP”。
回溯互联网的发展史,百度、阿里、腾讯这些以搜索、购物、社交等需求出发衍生出的超级APP几乎垄断了AI出现之前的互联网时代。
而在后AI时代,下一个超级APP可能会出现在通往AGI的路上。
前不久Open AI公布了AGI五级路线图,揭示了人工智能从"聊天工具"到"战略指挥官"的完整进化路径——第一阶段AI只是一个会“说人话”的对话工具,不需要刻意的编程语言可以交流;第二阶段AI变成一个颇有学识的“博士”,更准确、更快速;第三阶段AI成了一个超级助手,不止可以“chat”还可以“act”,从这里再往上AI就不仅仅是一个被操控的工具,更可以提出创意甚至管理一个跨国公司。
目前大部分市面的AI产品都处于第一、第二阶段,因此押注AI Agent就成了今年大模型厂商的主流叙事,Minimax也不例外。MiniMax在官网宣布,发布一款视频创作Agent:Hailuo Video Agent,并开放Beta版本。根据提示输入文字或图片,Agent将自动分析、构思并生成具有专业水准、富有观看价值的完整视频内容。
谈到出发点,MiniMax认为这会让“视频创意和生成更加普惠”。尽管视频生成技术在快速提升,但对于很多人来说,想要将创意转化为优质短片不是件简单的事。从创意构思、分镜脚本设计,到生成图片素材、生成视频并配音,再到精细化剪辑,这是一个对普通用户来说具有挑战的流程。此外,MiniMax还推出了一个能跑长程(Long Horizon)复杂任务的通用Agent,能多步规划出专家级解决方案、拆解任务需求、并能执行多个子任务从而交付最终结果。具体场景可以是写代码、生成PPT等。
从目前主流的Agent商业化路径来看,TOB比TOC先行一步。尤其是一些垂类场景,比如营销、办公软件等场景中的Agent已经开始和SaaS结合进行了商业化的探索。
科技投资人孔波(化名)就评价道,现在不论是做TOB还是TOC,通用还是垂直,从技术投入和难度上来说差别都不是很大,不过从商业化角度来看,TOC真正难实现的有两点:软件之间的联通,以及用户体验的极致。
孔波举例道,比如我现在做一个Agent,垂直赛道,就做出行助手。我现在决定从A点到B点,我把这个问题抛给Agent,后者给我规划一个最短路线、最短时间的路径,包括交通工具、预算等等,这并不困难,现在对话式的大模型软件就可以做到,但是Agent真正要解决的就是从Chat到Act的突破,因此一个合格的Agent其实是能够在收到这个指令的时候就调用我手机里的工具类APP完成订票、提醒我行程、监督行程这么一个过程。那么这个过程中涉及到两个点,其一,不同软件之间调用的授权;其二,涉及到付款的时候整个Agent的行为先后、策略合理性的一个考验。
相对来说,TOB的Agent也会有类似的问题,比如如何深入到企业的workflow中,在整个任务的思考、完成过程中,Agent不只要扮演一个角色,可能分担多个角色,这几个角色之间的权责划分、合作协同就是一个挑战。
“我相信下一个Super APP会出现在Agent赛道,目前市面上左右工具属性非常强的软件在Agent时代都可能被整合。从chat到Agent的演变也能看出,AI已经从卷数据、卷研究人员、卷研发费用这些“硬件”逐渐升级成了硬件实力够硬的同时还要卷定位、卷市场、卷用户体验这些“软实力”。而在这个赛道上,也许就会诞生下一个“超级APP”。