面壁智能开源MiniCPM-o 4.5:实现AI即时自由对话
2026-02-07 18:13 面壁智能

面壁智能开源MiniCPM-o 4.5:实现AI即时自由对话23

2月4日,面壁智能正式开源其新一代全模态旗舰模型——MiniCPM-o 4.5。该模型以9B(90亿)的较小参数规模,实现了对全模态理解、视觉、文档解析及语音生成等任务的行业领先水平(SOTA)覆盖,标志着端侧AI在交互能力与运行效率上取得关键进展。

MiniCPM-o 4.5的核心突破在于其“原生全双工”架构,彻底告别了传统AI“你问我答”的回合制交互。它能够实现“边看、边听、主动说”的即时自由对话。这意味着,在持续输出语音或文本的同时,模型仍能不间断地接收和处理新的视觉与听觉信息。

例如,在厨房场景中,它能一边回答问题,一边通过摄像头观察货架变化,实时告知水果价格;在公交场景中,它能主动感知到站信息并及时提醒。这种能力让AI从一个被动的“工具”转变为一个主动的“智能体”。

除了交互范式的革新,该模型在效率与效果上也做到了平衡。它解决了长语音合成中音色不统一、语气生硬的难题,并支持基于几秒样本的声音克隆与角色扮演。尤为值得一提的是,MiniCPM-o 4.5已成功在天数智芯、华为昇腾等6款国产芯片上完成端到端推理优化,这意味着它不仅聪明,而且“吃得少、跑得快”,非常适合在算力有限的手机、汽车、机器人等终端设备上本地化运行,兼顾了低延迟与高隐私。

面壁智能,成立于2022年8月,是一家脱胎于清华大学NLP实验室的AI独角兽。联合创始人兼首席科学家刘知远是清华大学计算机系长聘教授;联合创始人兼CEO李大海则是知乎前合伙人兼CTO。

公司自成立起便聚焦于“端侧大模型”路线,致力于通过提升模型密度,在有限算力下实现更强智能。其MiniCPM系列模型已在汽车、手机等领域实现规模化应用,并与多家头部企业建立合作。

从行业角度看,AI技术的发展重心正从单纯的“云端参数竞赛”转向“端侧应用落地”。业界共识逐渐形成:模型的密度、能效比以及在真实物理环境中的自主行动能力,将成为衡量其价值的关键指标。

高密度模型让AI在终端设备上“跑得动、用得起”成为现实,而全双工、多模态感知等能力则是AI向自主智能体演进的基础。同时,伴随AI生成内容的激增,如何构建有效的安全与治理体系,已成为行业必须面对的重要课题。

88.jpg