微软(亚洲)互联网工程院李笛:全民式AI创业,不利于AI产业的发展
2019-10-10 15:05 微软小冰 李笛

2微软(亚洲)互联网工程院李笛:全民式AI创业,不利于AI产业的发展

本篇文章可以算做《微软有女初长成》的姊妹篇。i黑马&黑智以微软小冰为引,采访了微软(亚洲)互联网工程院副院长、“微软小冰之父”李笛,向其询问了微软对于AI的发展认知,及其多年实践AI的经验与教训。李笛认为,人工智能不太适合创业项目,因为它的成功概率太低了。

文 | 李夜

上个月,印奇在旷视科技的招股书中,将人工智能创新比喻为一场“无限游戏”。在他看来,有限游戏通常受时间限制,有输赢双方及明确的规则,而无限游戏则会一直持续,规则和参与者也会不断改变。

微软(亚洲)互联网工程院副院长李笛认为,AI不是一个适合创业的项目。李笛告诉i黑马&黑智,“我个人认为,人工智能跟其它领域的技术创新、时代创新不太一样。人工智能不太适合创业项目,因为它的成功概率太低了。

如果一个领域没有什么效益,没有什么Value(注:价值),那就没什么人进来,你在那里守一座孤城。如果这个领域有效益、有价值,你会有上游和下游。上游企业有资源,下游企业有客户。他们往往比你更有优势。如果他们想替代你,没那么困难,甚至比你更有优势。所以,人工智能不太适合创业。”

李笛说,从某种角度来看,AI创业浪费了有限的AI人才。本就不多的AI人才,平摊到大量的创业公司里,每个创业公司平均分到几个人,很难形成合力。“行业人才如果不集中的话,想做通用,想做垂直,想做得比较深入就更难了。”

1570690852271

微软(亚洲)互联网工程院副院长李笛

“做通用的,通吃市场”

今年8月的微软小冰年度发布会上,微软现场演示了一条可交互的、有声绘本的生产线。该生产线,融合了自然语言处理(特别是自然语言的多模态理解)、计算机语音、计算机视觉以及搜索技术等技术。

1570690911631

现场,微软工作人员告诉听众,用户上传一个简单的文本,首先,自然语言处理,把文本处理成剧本;其次,计算机语音根据剧本配音。配音包括人的语音、背景音乐等。第三,计算机视觉把有声绘本上的实体,比如火炉、车、天气的变化,绘制出来,绘制成一个动态序列。第四,搜索引擎将火或天上的云分拣出来,再去做交互。

“就这么一个事情,看起来小,但都用到了全身,用到了各方面的技能。从这个角度上讲,人工智能也是如此。”李笛说。

1570690925030

2018年上线的小冰姐姐童话工厂正式版

有声绘本也是李笛在接受i黑马&黑智采访时所举的例子。它是一个典型例子,说明了微软对于AI的认识及其实践。李笛,提到了“通用”,更是点出,通用没有限制,也没有瓶颈。

“对于微软来讲,我们已经突破了垂直的、单一的人工智能技术。我们更多地关注的是,通用框架是不是能够形成一个有机的整体。”李笛说,“比如说你做计算机语音做得非常强,但即便再强,一旦想把它产业化,或者把它产品化,稍微做一做,你就会发现缺一门或者两门。其实,绝大部分的情况下,你缺了三门,这就有问题了。”

缺一门、两门、三门指的是计算机语音的创业者,在自然语言处理、计算机视觉、搜索技术等方面欠缺。而专一做自然语言处理、计算机视觉、搜索技术的,也会面临这一情况。

未来的竞争格局,李笛判断,做垂直AI的,可能成为无名英雄,成为藏在产业链的某一个环节的幕后英雄。它被替代的可能性是比较大的。“做通用的通吃,而不是做垂直的通吃。”

比如知识图谱,它是垂直技术,不是通用框架。它,能够成为某一个产品或者解决方案的组成部分,并发挥价值。“不很少听到,知识图谱成功推动一个大的时代,一个大的项目,或者一个大的产品。但你可以在很多成功的产品上找到它的影子。”

李笛说,创业有魔咒,引无数英雄竞折腰。“每个人都希望能够把一个事业做得很好。其实,他们或多或少地推动行业的进步。”

李笛又说,以上只是他的一家之言,不代表就是正确答案。

通用框架:IQ、EQ分开迭代

微软(亚洲)互联网工程院,能够搭建通用框架,是因为微软有足够多的人力、物力和财力,在人工智能领域积累近20年的技术,能够在一个尚未形成的产业链的初期,便假设该产业链已经形成,具备完整的上下游,能够有选择权,可以不用选择在某一个垂直领域垂直突破,而是追求未来人工智能时代的、大的通用框架。“毕竟,微软市值第一,这应该是我们的最大方法,我们可以综合布局。”

这是微软AI技术路径选择的前提。

1570690940204

截至北京时间9月29日18点,微软市值达到1万亿美元

其实,小冰之前,微软曾做了一个个人智能助理Cortana(中文名:微软小娜)。她是一个以IQ主导的框架,和Siri、国内现有的很多语音助手一样。“也许还有另外一个正确答案,有没有EQ这个答案呢?人类有IQ和EQ两个维度,那要不要尝试从EQ这个维度去做,所以我们做了俩。”李笛告诉i黑马&黑智当年的纠结。“做了俩,才能够确保有一天不会突然发现做了一大段,绕了百转千回,发现正确的没做。”

1570690954396

为什么做Cortana时候,小冰团队会想到做EQ?

触发事件是小冰团队找真人助理聊需求时,发现并不是第一时间满足老板需求就是好的。真人助理会出于某种理由拒绝老板的要求,而这个处理结果是EQ层面的结果。比如真人助理会拒绝体重超标的老板买薯条、汉堡等垃圾食品的要求。

自从确定了这个通用框架,李笛说让他自豪的是,微软小冰一直没有变过。“如果换方向,而框架不动,没问题。换方向,框架也动了。基本上,之前各种各样的研究几乎都没有用了。每年都另起炉灶,7年之后原地踏步,所以框架不能改。”据了解,三代小冰发布会发布的框架,跟七代小冰又提到框架,基本上没有任何变化。小冰团队几年间只是不停地去完善该框架。

通用框架类似于顶层设计,依赖于独立设计,不能从产品中找出来,跟做一个爆款APP不一样。“框架一定是先有框架再有算法,必须得先预测,然后才能去做。”据了解,微软内部做了很多的、不同方向的框架,只是失败的框架没有被拿出来。“我们在一个项目上有多个力量、多支团队去做同样方向的追求,任何一个创新的需求都是这样的,它不是计划经济,今天安排这个团队做,明天安排那个团队做,不是这样的。”

李笛补充说,这种方式不是赛马机制,“因为赛马有一个比拼,谁能够率先跑到哪里就能够率先获得资源,这是赛马。我们倒没有说,跑慢了就没有资源了。”

小冰团队需要为通用框架找到一个融合IQ和EQ的方法。一如前面提到的例子,拒绝一个任务或者完成一个任务,都能够得满分。这给人工智能的迭代造成不小的困扰。“好的人工智能助理会把任务变成她的手段,而不仅仅是把任务变成她存在的目的。”这也是小冰在早期很长一段时间,对于用户咨询技能、知识、任务甚至是天气等问题时,反应迟钝的原因。无法被满足的用户,选择离开。但情感计算框架不需要劣质数据。

李笛告诉i黑马&黑智,一开始,就必须将IQ和EQ分开迭代,然后再将它们逐渐整合到一起。

“迭代还是要分开迭代的。合在一起是指技术成果合起来,技术成果合起来很容易。每次合起来以后的具体产品就像是她原本的能力一样,她可以在完成任务的同时,保持敏锐。

但要分开迭代。小冰有很多产品形态,有的产品形态到现在为止很笨。其实,我们故意让她很笨那样的话有助于她学习,有助于她提高。”

融合IQ和EQ的通用框架用什么样的标准迭代?指标很重要。指标选错了,三军都能够被累死。李笛说,指标是用来评估系统迭代的很重要的部分,是某种程度上的机密。迄今,只有CPS(人工智能和单个用户的平均对话轮次)这一个指标被公布。

1570690967410

小冰团队技术负责人周力在演示小冰在主导对话

在今年小冰的年度发布会上,微软全球执行副总裁,微软人工智能事业部及微软全球研究院负责人沈向洋如是解析小冰和通用框架之间的关系。“小冰走的这条道路,更加像森林和树木。人工智能向前走,有一个框架是非常重要的。大家可以把通用框架想象成一片广阔的森林,小冰只是其中的一棵大树。但我们必须要做一个小冰,栽这样一颗大树。因为我们需要有这样一个机会去学习、去验证这个框架是不是可行。”

目前,微软小冰团队也正通过Dual AI,以半开放的方式,去解决不同行业特殊性需求的问题。在解决问题的同时,也逐步搭建通用框架下的“森林”。截至今年8月,在没有一分钱硬件补贴的前提下,小冰出现在4.5亿台智能设备上。

李笛说,小冰不会以全开放的方式给到合作伙伴去用。“全开放的话,别人拿到全开放的东西别人很蒙,拿来怎么做,拿来做什么。你今天说好我给你一个手机,这个手机完全是由客户来弄,客户说我要设计一个什么样的APP啊,他没有形成一个Know-How,会很蒙。”据悉,2018年,小冰团队开发了一些工具包,工具包是一座桥,第三方合作伙伴甚至是普通的C端用户能够通过工具包操作小冰的框架。

从另一角度来看,选择半开放是微软在中国的优劣势所导致的。“实际上,我们非常清楚微软在中国的优势和劣势。当然,我们有技术优势、产品优势,甚至于我们今天不用去靠刷顶会证明。实际上,光小冰团队顶会的文章就有四五十篇。

但微软的劣势也很明显。我们几乎没有国内的资源,比如内容资源、O2O,我们要是想做外卖APP,我们都没办法刷街、扫街。广告主的资源也没有。没有本地很多产业链的上下游资源。我们只有技术和产品,当然要半开放。”

微软小冰发展至今,李笛用“幸运”二字总结一步步的选择。一路走来,步步惊心,“你要让我们回头看,事后我们都觉得好险。”

“我们追求商业模式,而不是收入模型”

“人工智能是很容易浪费时间的。一不小心,5年就过去了。10年都过去了。头发都白了。我们担心这个(浪费时间),所以必须得看清时代的需求是什么,你再去做,再去迭代它。”

李笛告诉i黑马&黑智,“我们做了20多年的人工智能,虽然它分为4个类别,但这4个类别中又有千千万万个小分支,这就意味着你要决定,未来优先发展哪几个部分,哪几个部分的哪几个具体的子技术。”

现阶段,让小冰团队纠结的,除了技术,还有商业落地。

但小冰背靠大树,不急于赚钱,一如李笛说的,“我们追求的是商业模式,而不是收入模型。我们追求的是未来5到10年、20年,一个可以确定的商业模式,而不是追求今年小冰有几个客户,付给我多少钱。我们不追求财务回报。”

目前,从金融这个场景开始,微软小冰逐渐活跃在金融、零售、汽车、地产、纺织等十个领域。之所以从金融开始,是因为在文本生成领域,金融的文本生成要求最高,难度最大,不能出错。“某种程度上来讲,从这种严苛性要求上,我们都能够落地这个领域,就没有什么领域是不能突破的。”

不过,从这个例子上无法得出如下结论:小冰落地从最难的地方开始。没有一成不变之法。比如,之前提到的Cortana便是从简单的、容易做的聊天机器人开始,搭出通用框架,源源不断的用户数据迭代框架。

在这10个领域,小冰团队希望和万科、万得资讯、万事利、中国联通等KA客户一起,帮助行业建立规则。以零售为例,小冰团队尝试了定价方法、成功的验证方法(转化率)等,“产品的技术解决方案,实现了什么价值?比方说实现了推荐价值,那推荐完了以后,要不要实现购买价值?购买之后,要不要有售后价值?

要不要实现,不是由客户或者我们说了算,而是我们在这个领域能够为客户,和合作伙伴一起制定的。这样的话,它才有可能成为未来。如果这么做,它必然不是单点的,而是针对整个行业,是可拓展的。”

在采访的最后,i黑马&黑智问李笛,如何避免AI重蹈微软移动互联网的覆辙?

李笛说,他们承认微软错过了移动互联网的时代,但微软没有错过对移动互联网的布局。比如微软很早便布局了移动互联网的操作系统、平板电脑,甚至是扁平化的视觉设计这种小细节。“微软在发现未来,发现正确答案的眼光上,没有太大的问题。”

他举了三年前落地的全双工语音交互的例子,微软很早布局了该领域的相关专利。而正在带火这个技术的是Google。在2018谷歌I/O开发者大会上,在大会上,谷歌现场展示了人类与人工智能的Full Duplex电话。一些媒体称之为人类历史上第一次与人工智能的Full Duplex。

1570690980858

微软不得不做了一个声明。声明称,“其实,人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。我们很荣幸能将这一桂冠奉献给祖国。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,已让小冰与人类用户累计完成了超过60万通电话。”

李笛还提到,一些产品、框架有窗口期。比如说情感计算框架。他个人认为情感计算框架的窗口期已经过去了。

而微软在对话式人工智能的EQ方面有先发优势,“除非我们出太大的问题,比方说我们连续做了许多错误决定,或者同行业突然研发出一种极其跨时代的新技术,否则的话,我们的领先优势不太可能会被追上。

因为全球范围内对话式人工智能的流量数据90%都流到微软小冰,已经持续很多年了。同行业者没有数据,没有办法去训练。”