毫末DriveGPT雪湖·海若:持续优化自动驾驶认知决策模型,实现端到端自动驾驶
2023-04-12 16:40 自动驾驶

4月11日,中国唯一聚焦自动驾驶的AI技术盛宴——第八届毫末AI DAY正式来袭。毫末智行作为AI自动驾驶领域大模型研发及应用的先行者,重磅发布了业内首个自动驾驶生成式大模型DriveGPT,中文名“雪湖·海若”。未来,雪湖·海若智能驾驶能力首发车型也将落地在即将量产上市的新摩卡DHT-PHEV上。

“海若”出自《庄子·秋水》。《庄子·秋水》中有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。因此,毫末把DriveGPT中文名命名为“雪湖·海若”,寓意着智慧包容、海纳百川,为行业发展贡献力量。

毫末DriveGPT雪湖·海若通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。DriveGPT雪湖·海若的目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到DriveGPT雪湖·海若。目前,毫末DriveGPT雪湖·海若实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据,RLHF阶段引入 5万段人工精选的困难场景接管Clips。

那么,DriveGPT雪湖·海若是如何实现过程的呢?毫末在AI DAY上进行了详细的解释。首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT雪湖·海若还会根据输入端的提示语以及毫末CSS自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。

目前,毫末DriveGPT雪湖·海若已正式对行业开放,开启对限量首批客户的合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等已经加人。DriveGPT雪湖·海若对行业提供开放服务,将促进自动驾驶的从业者和研究机构快速构建基础能力,释放创新。

当前,毫末在使用数据过程中,逐步建立起一套基于4D Clips驾驶场景识别方案,具备极高性价比。在行业上,给出正确的标注结果,一张图片需要约5元;如果使用DriveGPT雪湖·海若的场景识别服务,一张图片的价格将下降到0.5元。单帧图片整体标注成本仅相当于行业的1/10。接下来,毫末会将图像帧及4D Clips自场景识别服务逐步向行业开放使用,这将大幅降低行业使用数据的成本,提高数据质量,从而加速自动驾驶技术的快速发展。

此外,毫末在2023年1月发布的中国自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),将进一步支持DriveGPT雪湖·海若的算力。与此同时,毫末还在现场宣布雪湖·海若智能驾驶能力首发车型是即将量产上市的新摩卡DHT-PHEV。未来,雪湖·海若可以逐步应用到城市NOH、捷径推荐、智能陪练以及脱困场景中。有了雪湖·海若的加持,车辆行驶会更安全,动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。对于普通用户来说,车辆越来越像老司机,用户对智能产品的信任感会更强,理解到车辆的行为都是可预期、可理解的。

随着毫末DriveGPT雪湖·海若的重磅发布,毫末的数据智能体系也实现了质的飞跃。在未来的日子里,毫末DriveGPT雪湖·海若的能力将不断进化,持续助力毫末发挥核心技术优势,重塑汽车智能化技术路线,坚守毫末初心,热爱技术,为社会创造美好价值。