面壁智能发布端侧大模型MiniCPM 4.0
2025-06-09 15:43 面壁智能

6月7日,面壁智能发布端侧大模型MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高220倍提速,常规5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。MiniCPM 4.0系列LLM模型拥有8B、0.5B两种参数规模。针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用了“高效双频换挡”机制,能够根据任务特征自动切换注意力模式。