揭秘达摩院:一家“接地气”的非典型研究机构
2019-07-17 10:13 达摩院 iDST 马云 阿里巴巴

2揭秘达摩院:一家“接地气”的非典型研究机构

马云希望“达摩院”能够“活得至少要比阿里巴巴长”。

文 | 李夜

马云希望阿里巴巴能够成为102年的公司。若愿望成真,成立于1999年的阿里巴巴,将横跨三个世纪(20世纪、21世纪、22世纪)。2017年10月,马云与13位全球顶尖科学家畅聊后,阿里巴巴宣布成立“达摩院”。马云希望“达摩院”能够“活得至少要比阿里巴巴长”。

图片 1

建立达摩院,并不是马云的心血来潮。它的历史最早可以追溯到2014年,阿里巴巴在硅谷成立 iDST(数据科学与技术研究院),以储备人工智能的技术和人才。2014年这一年,据不完全统计,目前AI独角兽榜单上的常客大多已经入场。2014年前后,AI逐渐名声大噪,走入大众视野。2011年,IBM Waston 系统参加美国“危险边缘”(Jeopardy!) 节目,打败人类选手。2012年,深度学习算法通过 ImageNet 比赛名声大噪,进而被广泛采用。2016年,DeepMind 开发的 AlphaGo 击败前世界围棋冠军李世石。

对于外界来说,无论是iDST还是达摩院都是颇为神秘的机构。

近日,i黑马&黑智参加了阿里巴巴组织的达摩院媒体下午茶活动,得以近距离地观察达摩院。达摩院机器智能技术事业部首席架构师王骏、达摩院语音实验室负责人鄢志杰等参与了本次活动。活动上,阿里巴巴还发布新一代语音合成技术KAN-TTS。阿里巴巴称,该技术极大地提高了合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。阿里已经对外提供开箱即用的TTS解决方案,共有通用、客服、童声、英文和方言5个场景的34种高品质声音供选择。

iDST和达摩院

前面提到,iDST是达摩院的前身,但i黑马&黑智想重点提到的是,iDST的科学家被下放到业务一线的传统。

原蚂蚁金服首席风险官胡晓明接替王坚,出任阿里云总裁,iDST发生人事调整,漆远被调入蚂蚁金服;金榕被调入淘宝天猫搜索部门。漆远是美国麻省理工学院博士后,普渡大学计算机系和统计系终身教授。金榕是前美国密歇根州立大学终身教授,现任阿里巴巴iDST首席科学家和副院长,阿里巴巴达摩院机器智能技术实验室主任。

两位学术大牛,下放到业务一线并未出现“水土不服“。相反地,他们各自做出了业绩。据雷锋网报道称,漆远去了蚂蚁金服后,包揽了6项阿里巴巴集团算法大奖(共16项),其中包超大规模机器学习平台。金榕的团队也拿到了集团CEO大奖。金榕还打趣,自己和团队在天猫搜索部门的经历,犹如知识青年上山下乡。虽然很苦,但真正体会到用技术去解决业务问题,比想象中复杂很多。

2

iDST的学院派的基因和“上山下乡“的传统是理解达摩院的一个线索。达摩院是一个技术机构,但也是立志成为“第五大经济体”的阿里巴巴之下的研发机构。以下为i黑马&黑智总结的达摩院的特点:

第一,达摩院的研究领域,大且底层。

目前,达摩院有大几百人,半数以上的人具有博士学位。办公室分布在四个国家八个主要城市。研究领域涵盖机器智能、数据计算、机器人、金融科技、X实验室等5个方面。那么,达摩院的AI研究边界是什么?

王骏在活动现场说,“互联网有三个要素:语音、管道、device。达摩院没有管道,其他的都有。”他还提到,“视觉、语音、语言,是人的三个重要通道,相应具有视觉智能、语音智能、语言和知识,你接到信号之后,还要进行预测和判断,这是一个决策判断。(我们)希望通过这四个技术方向研究,让机器处理一些复杂数据,能帮我们达到一定程度的智能。”

3

第二,落地为王。

现场有提问,让台上的王骏、鄢志杰比较一下达摩院和微软亚洲研究院的同与不同,鄢志杰提到了很重要的一点:我们建这个团队的时候,想把研究跟工程放到一起。这样做的好处是新技术可以迅速转化为产品。

活动上推出的新一代语音合成技术KAN-TTS便是其中之一,从雏形到产品上线的周期非常短。KAN-TTS的介绍PPT里,用了很多篇幅讲业务需求,讲普通用户只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。“我们团队……可能不会做那种无厘头的纯探索的事”, 鄢志杰说。

在活动上,有记者问王俊,机器智能今年有营收预期吗?王俊回答说,“有也没有,……我们部门的价值是被集成的价值,而不是简单的商业价值。”被集成到哪里呢?阿里云。

去年11月,阿里组织架构调整。阿里云升级为阿里云智能,而阿里巴巴CTO张建锋(行颠),同时兼任阿里云智能事业群总裁。张建锋表示全集团的科研力量将融会贯通,达摩院的能力与云全面结合。未来,还将加大研发投入,扩大云的技术代差优势。张建锋还总结了阿里云战略加速的“四级火箭”:达摩院加持的云、数据智能的云、最佳实践的云和被集成的云。

据悉,张建锋是达摩院的院长,同时也是阿里云智能的负责人。达摩院的技术通过阿里云对外输出,阿里云同时是达摩院加持的云。

落地、边界与扩大

理解达摩院离不开阿里巴巴这个巨大而又复杂的“经济体”,阿里巴巴集团拥有电商、物流、娱乐等丰富的业务场景。这些丰富的场景既是达摩院技术的试验场,也为其技术探索提供可以思考的方向。在本文的这一部分,侧重关注其试验场的这一个方面。

“我们比较有机会在支持业务的过程中,先把技术提炼出来……这个技术(注:机器智能)从拍立淘的搜索,大概有将近5年的时间,支持手淘的需求,工作量都是千万级的,再去把这个技术形成一个图像,后面我们从图像搜索做到图像识别。”王骏说。

王骏的回答有一个重要的信息点:对内执行和对外执行。技术或者产品一经做出,先拿到阿里巴巴的业务场景中试用,而后对外开放。由内而外,达摩院不可避免地遇到如何解决对外过程中遇到放大问题?如何解决对外过程中,不同场景的特殊性的问题?

鄢志杰提到,对内和对外有所区别。“对内无非是支付宝客服、淘宝客服遇到问题……找自己实验室的兄弟去干了。在对外的时候,你会发现,扑面而来的很多很多客服中心的需求就过来了。”

如何解决?用共创的方式。鄢志杰说,他不太想用“赋能”这个词来形容他们与合作伙伴的合作。“……我不想用赋能,好像显得我们很有能一样……”

在对外服务的过程中,达摩院还提炼出了“自学习平台”的概念,“我们的集成商有自己的领域知识,可以通过自己的标注贯通到系上面来。(我们)突然发现把这个方向拿来交到了他的手上,你会发现,A、B、C、D有好多客服领域的经销商,今天他能够用自学习达到他所关心的垂直领域里最好的语音识别的精准度,能够找到客服一线的人,把他的语音数据放到TTS里面,学出一个特别有客服范儿的声音,在这种情况下优化效果,自学习通过这个过程提炼。”

目前,2019年,中国正式进入5G商用新阶段。5G,是一个全新的网络基础,是产业互联网基础设施。它将开启万物泛在互联、人机深度交互、智能引领变革的新征程。创业黑马发起《5G新经济独角兽TOP50》榜单评选,寻找推动5G与产业融合的先锋,就等你来,欢迎点击链接报名:http://form.heimadata.com/b/form_1460?id=5d2693764ba5c3511efea2e3&fm=ydy&share=4499469