2017 AI大师会详解智能商业决策之路:从“识别”到“思考”
2017-06-27 10:19 杉数科技 AI 数据驱动 商业决策

本次大会嘉宾从深度学习在时空大数据分析中的应用谈开,详细解剖商业智能中的机器学习、深度学习,以及少为人知却直指真实场景中复杂决策的运筹学。

i 黑马讯 6月24日消息,由钛媒体和杉数科技联合主办的“2017AI大师论坛”在京成功举办。Stanford讲席教授叶荫宇坐镇,佐治亚理工学院、明尼苏达大学、纽约大学、清华大学青年领袖学者助阵,从深度学习在时空大数据分析中的应用谈开,详细解剖商业智能中的机器学习、深度学习,以及少为人知却直指真实场景中复杂决策的运筹学。

谈起人工智能,在我国最先被提起的往往是横扫围棋大师的AlphaGo。但在业界,更令人吃惊的标志性变革发生在德州扑克:不需要准备海量棋谱,也没有充分公开的完美信息场景,化名“冷扑大师”的AI系统直接针对对手的劣势自我学习、通过博弈论选取最优策略,横扫德扑顶尖高手,“高情商”令人瞩目——不完全信息场景,正是错综复杂商业运作中常常面临的困境。

李开复说,“冷扑大师”战胜人类的意义,就在于“更多人通过比赛了解到了更全面的人工智能,知道AlphaGo所代表的代表的深度学习并不是人工智能的全部”。

商业智能时代,量化决策势不可挡,如何从汹涌的AI泡沫中找到正确方向,是学界和业界共同关心的议题。国内集中了运筹优化领域最优势学术资源的杉数科技希望就相关问题与业界人士进行深入探讨。

以下为演讲节选:

杉数科技CTO、明尼苏达大学助理教授王子卓首先谈到由数据驱动的定价策略,他认为好的定价策略是一家公司的“生命线”,在比较广泛的意义上来说,一个好的定价策略,需要在正确的时间,正确的地点,以正确的价格,把正确的服务和商品卖给正确的消费者。如何在价格和需求量之间找到平衡,获得最大收益,需要企业充分利用数据进行智能决策,机器学习、人工智能技术、运筹学的技术都是必不可少的。

在不同的商业领域里,有很多不同的定价场景,具体的定价场景非常复杂。总结杉数科技的具体工作经验,可以把场景分为6大类。

以标准定价为例,在杉数科技和多个互联网企业的合作中,就需要刻画消费者的商品选择行为,从而利用消费者对不同商品的需求关联性,推动消费者在一次消费中购买多件商品,以提升单次消费的客单价,增加收益。这就需要综合考虑采销业务需求或公司战略要求、商品的历史销售与价格数据、及基于用户行为数据分析得到的消费关联特性,构建联合定价的商品池;基于联合定价商品池,综合考虑友商价格、季节性、促销、替代品与互补品等因素的影响,构造出需求函数模型,并在此需求函数形式下构建多SKU联合定价方案,实现全局销售收益最大化,产品量达到百万级。

王子卓博士指出:“之前很多人觉得,销量、利润、营业额,这几个可能是互相矛盾的指标,可能说想提升销量就必须降低利润,但是实际上并不是这样。我们在这里进行组合优化之后就可以发掘每一个SKU它的一些特性,充分利用每一个SKU它自身的一些特性,可以达到对这些指标的整体的提升。这也是我们觉得用数据驱动的这个定价非常有潜力的一点。“

在复杂多变的商业环境下,实施智能定价的环节以及产品化需要很高的技术门槛,而完整智能定价流程如何给公司收益带来了显著提高。杉数科技创始团队自2016年以来,利用自己在定价方面的独特积累和技术,已经为国内多个行业的龙头企业,包括电商、物流、出行等,提供了收益管理方向的精确量化软件开发和咨询服务,合同额达到了近2000万。

纽约大学助理教授陈溪介绍了前沿机器学习应用,解答通过机器学习应该如何做决策的问题——真实商业场景中的问题都是决策问题,好的预测并不等于好的决策。目前,人工智能对于决策或逻辑上的推导还相对薄弱。因此,传统的机器学习虽然在飞速发展,但也迫切需要与运筹学、统计学结合起来,才能够使机器学习在商业当中得到广泛应用,让用户产生的数据变得更有价值。

在演讲中,他讲解了多臂老虎机问题(Multi-Armed Bandit Problem,MAB):不同老虎机有着不同的收益反馈,但每一次拉动老虎机时,老虎机的反馈数值是随机分布的。如何进行最少的尝试、尽可能多地确定老虎机的整体收益反馈水平,映射了很多实际生活的问题。比如要比较两类广告对于用户的吸引力,如果通过传统方法对于用户进行随机测试,即使只有20款产品,对应的数据量也是巨大的。

多臂老虎机MAB算法有着广泛的商业用途,比如电商可以把该算法用于某个产品消费群体的认知和开发。2014年,王子卓、叶荫宇等人的一篇学术论文讨论了用于单一产品收益最大化管理的MAB算法,陈溪博士、李建博士以及其他杉数科技科学家在此基础上不断研究,并在杉数科技与某电商的实践中设计相关算法,该电商定期给女性顾客寄一个内有5件衣服的盒子,顾客可以选择一件付款再把剩下的退回,如果5件衣服都不喜欢就会象征性收取邮费。以此来探知女性消费者的消费行为数据,并用于相应算法的开发。医药、广告、拍卖、金融科技都是可以应用的领域,机器学习落地点遍布商业领域,但必须和其他学科充分合作。

清华大学助理教授李建的分享聚焦时空大数据分析,以深度学习应用的五个例子详细阐述深度学习应用的难点、重点、要点。为人所熟知的深度学习往往是图像识别、人脸识别、语音识别,或者说自然语言处理。而将时空大数据和深度学习结合起来的并不常见。时空大数据的特点是,数据类型非常丰富,比如GPS、订单数据、天气数据、路况数据等。这与语音识别、图像识别不同,需要把不同质的数据组合起来进行学习和预测,来应对这一复杂商业场景提出的实际挑战。

通过对于交通路况的预测,可以解决网约车供需匹配、交通部门协管交通状况等等问题,而订单预测则对于在线租车的车辆调度、物流网点的资源匹配等十分必要。物流公司和其他相关产业的选址问题、无人驾驶对于障碍物的预判等等也都需要相关的辅助。时空数据在各行各业中海量产生,对于这些数据的合理挖掘与利用可以帮助生产者乃至整个社会提高生产效率。

佐治亚理工学院终身教授蓝光辉的演讲则围绕(大规模)优化算法在机器学习、深度学习中的应用展开,近几年,机器学习和人工智能得到突破性发展,在银行、保险、营销、通讯、医疗等等领域得到了广泛应用。他指出,在这些商业应用中,“除了用机器学习来做预测以外,最重要是要做决策。建立模型再做决策,涉及到优化的系统集成,不管是在机器学习过程中还是在决策过程中,都需要用到优化模型或者算法。”优化算法的系统集成,即求解器(Optimization Solver)。问题规模、难度越大,求解精度越高,对于求解器的要求也就越高。杉数科技的科学家们一直着力落实叶荫宇教授的主张,积极投身于开发自己的机器学习与深度学习算法求解器。同时也帮助上海财经大学协同开发国产的最优化求解器的开源软件,推进我国开源社区在优化算法方面的进展。

目前世界顶级的机器学习求解器分别是H2O和TensorFlow,与H2O、TensorFlow这两大界顶级机器学习求解器在9个公开数据集上进行对比测试,杉数科技的机器求解器软件优势明显。例如,在针对经典分类模型的通用数据集上,杉数科技求解器的求解速度在所有数据集上均大幅高于TensorFlow,提升速度为10倍~70倍不等;而在计算速度大幅领先的情况下,杉数科技求解器预测效果仍基本高于TensorFlow。在回归模型的测试中,在3个公开数据集上的对比测试来看,在不影响求解精确度的情况下,通过选择合适的超参数使得杉数科技求解器软件的求解速度仍快于TensorFlow数倍,而预测效果则大致相当。也就是说,中国的科学家们已经掌握了并不落后,甚至领先国外的核心算法及软件工具。而相关学科还需要更多的人才储备,则是整个教育系统需要考虑和应对的问题。

最后,斯坦福大学讲席教授叶荫宇结合杉数科技的实际案例分别讲解路径优化、库存管理、投资组合三大应用。1982年就去美国斯坦福读书的他看待今日的AI热潮,有着独特的历史眼光。他回忆,自己刚到美国时就经历了一次 AI 的火爆和降温,今日的AI解决了当年所未能解决的很多问题,而纵观热潮的起落,“优化”始终如同不动点,在各行各业发挥着重要作用。

比如库存管理上,在杉数科技的实际实践中,可以将电商的周转率从25天降到 16.5天,使得库存金额降低19.2%,现货率也有提升,GMV 上升1.9%。而且杉数将自己和大型电商的合作经验产品化,转化为服务于中小企业的产品stockgo,解决四大核心问题。他鸟瞰优化算法的现状与未来,也对于商业智能的宏观图景进行把握。