自人工智能进入工程化应用的产业爆发期后,国外头部科技企业均已推出MLOps解决方案并涌现出一批提供MLOps解决方案的创业公司,国内头部科技企业则在AI中台上逐步扩展流程管理功能,逐步推出MLOps解决方案。然而,在此过程中产业遇到了用户方要花费大量时间精力做调研、选型、需求匹配、验收等工作,产品方缺乏行业共识,经常要面临大量定制化需求的难题。因此,为AI研发运营管理体系制定一套全方位的标准规范,加速人工智能应用的研发和落地势在必行。
日前,中国信通院云大所于“AI工程化论坛”上发布全球首个AI模型开发管理标准——《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》。通过“以评促建,以评促改”系统性评估企业人工智能项目研发运营一体化(开发管理)水平,查缺补漏,持续改进,横向对标行业内优秀实践和能力,取长补短。作为《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》系列标准的首个标准,填补了国内外机器学习项目开发管理标准的空白。
其中,标准第一部分“开发管理”将面向具备自研能力的用户方企业、ModelOps/MLOps 开发平台产品提供方等对象,以需求管理、数据工程及模型开发三大能力子域作为开发管理的切入点,为具备人工智能软件研发交付运营能力的组织在实施模型开发管理过程中的能力给予评价和指导。
云测数据作为高质量、场景化的AI训练数据服务领域的企业代表,与华为、百度、京东、中原银行、工商银行等30多家金融、运营商、头部科技企业共同编制。作为《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》的编写单位之一,云测数据已经建立了数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值。
自成立以来,云测数据一直以技术创新加速行业发展为己任,先后推出“云测数据标注平台”、“AI数据集管理系统”等技术成果,为AI相关企业提供处理大规模感知数据的能力,持续为计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域提供高价值数据支持。通过人工智能数据“采、标、管、存一站式服务”,实现了“数据原料”到最后的“数据成品”全链条打通,为人工智能应用输出完整的数据价值,进而推进AI产业的场景化落地。
以云测数据在标注平台工具的技术能力为例,通过结构创新、智能化、工程化、标准化的标注平台产品赋能AI训练数据行业,可从质量、效率等方面激发数据价值,为企业提供处理大规模感知数据的能力,进而推进AI产业的场景化落地;又如云测数据在自动驾驶数据服务领域的深耕探索,其一站式自动驾驶数据解决方案在为相关需求企业提供大规模感知数据能力的基础上,帮助智驾企业减少数据采集周期、提升数据标注效率、降本增效,助其更快更好发展。
在整个AI数据服务过程中,云测数据通过工程化的赋能,将数据采集、数据传输、数据清洗、数据标注、数据管理等进行集成,并提供多维度、场景化的数据服务与策略,广泛地覆盖人工智能不同场景下的数据服务能力,满足AI应用在数据质量、数据丰富度、数据时效性等方面的需求,最大化发挥AI数据的基石作用。与此同时,云测数据也一直在推动相关领域的数据标注等标准的制定工作。目前,云测数据参与的《智能网联汽车激光雷达点云数据标注要求及方法》、《智能网联汽车场景数据图像标注要求与方法》已相继发布,积极促进了AI数据标注的场景标准化、提升了AI数据的通用性和易用性。