阿里迎战智能音箱,一夜之间智能语音终端成为“红海”了?
2017-07-06 10:44 阿里 智能音箱 百度 天猫精灵 DuerOS

就在同一天,百度DuerOS开放平台和阿里音箱,走到了开发者面前。

文 | 杨洁

编辑 | 黑智

阿里做消费级AI硬件了,第一款产品,是款智能语音终端设备,名字叫做“天猫精灵X1”。

智能音箱这片江湖,对于吃瓜群众而言可能还略有陌生,但随着阿里的进入,却顿时有了“血海”的架势。

而就在同一天,百度的AI开发者大会上,百度发布了DuerOS开放平台,并称之为“人工智能时代的安卓”,打造基于百度DuerOS为入口的智能语音生态链。

搭载了智能语音助手的智能家居,尤其是智能音箱市场,在2017年,也陡然变得热闹。从海外的亚马逊、谷歌、微软、苹果,到国内的BAT,短短几年内,在这个看似狭小的领域内,迅速集中了几乎所有的互联网巨头,同时,包括到创业中小公司,再到传统音箱厂商、家居制造商,连内容提供商们,也忍不住要来分一杯羹。大大小小数百玩家,顿时让本来略显沉寂的家用智能设备领域,变得拥挤起来。

只需499元,智能音箱抱回家?

阿里的智能音箱是什么样的?

这是一款比亚马逊Echo、苹果HomePod体积更小也更轻的智能音箱,直径只有83毫米,高度126毫米,摆在家里显得更为不“显眼”。底部设计了一圈隐藏指示灯,会通过声音来判断用户方位。在配置上,X1 采用了业内首颗 SmartAudio专业处理芯片,阿里方面表示,比此前市面上的主流芯片,处理效率提升25%,功耗降低32%。X1搭载了6麦克风环形阵列,能够在家庭环境下实现5米范围语音识别。

阿里人工智能实验室负责人浅雪发布天猫精灵X1

和Echo一样,天猫精灵X1目前可实现智能家居控制、语音购物、手机充值、叫外卖、充话费、查快递、音频音乐播放等功能。

而类似Google Home,天猫精灵内置了声纹识别,可以识别用户对象,成为“你的语音设备”,并针对用户的淘宝账号进行购物和支付、充值。据阿里人工智能实验室透露,一款设备,可以实现对6个不同对象的声纹识别。而这款音箱,只需要499元。

与此同时,作为阿里智能音箱的主导机构,阿里巴巴人工智能实验室也终于露出了真容。阿里表示,人工智能实验室(A.I. Labs)成立于2016年,负责阿里巴巴集团旗下消费级AI产品的研发,其使命是“探索人机交互新大陆”。阿里人工智能实验室负责人是浅雪(陈丽娟)。而浅雪,也是当年阿里智能生活事业部的总经理,曾经和其他厂商合作推出过智能音箱产品“小飞”和“MA1/3/5”。据媒体传闻,该实验室直接向CTO张剑锋(行癫)汇报,而在发布会当日,张剑锋也来到了现场。

浅雪当天还表示,天猫精灵X1内置了由阿里人工智能实验室研发的第一代中文人机交流系统AliGenie语音助手和开发者平台。而AliGenie开发者平台,主要面向四种类型的开发者,包括内容开发者、应用开发者、智能家居开发商和硬件生产商。通过AliGenie开发者平台,开发者可以链接到阿里生态体系中的数亿消费者和海量的生活和商业场景。

而这,不由得让人联想到百度发布的DuerOS开放平台,开放了百度17年来在语音识别、深度学习、自然语言处理技术、多轮对话技术、搜索技术等上面的积累。同时,百度宣布将全资收购KITT.AI,并将智能设备语音唤醒和自然语言处理等核心能力免费开放。更有趣的是,百度还现场演绎了智能设备开放平台的便捷性:一名工程师,通过十七行代码,用1分钟的时间,将百度DuerOS的能力接入搭载Alexa的Anker音箱,让原本只会英文的音箱变得能够听懂中国话。

百度度秘事业部总经理景鲲发布DuerOS开放平台

 语音助手和智能音箱,成为巨头们必争之地。

为什么是智能音箱?

这场战事肇端于大洋彼岸,也是海外的科技巨头们,最早将它推向了高潮。

今年5月9日,亚马逊发布了新款带触屏的Echo Show;就在次日,微软和哈曼卡顿合作、搭载了语音助手Cortana的智能音箱invoke正式面世;Google I/O 大会上,Google Home的全新功能亮相;6月的2017年WWDC上,苹果的Siri音箱HomePod压轴推出。至此,亚马逊、谷歌、微软、苹果等巨头,已然在智能音箱市场正式会师。

天猫精灵、苹果HomePod和Amazon Echo

基于亚马逊智能助手 Alexa 的Echo点燃了这片市场。到了2016年11月,Echo问世两年后,根据消费者智能研究机构 CIRP的报告数据,这一系列产品在美国的销量已经达到了 510 万台。整个2016年,Amazon Echo 卖出了超过 650 万台。

Echo之于亚马逊的意义,自然也不仅是一款家用的音乐播放器。它让大众感受到的,是基于语音交互的硬件时代的体验;作为家庭设备中枢,Echo连接了家用智能设备、互联网服务以及数据,为亚马逊建立起了数据和算法的壁垒,同时,也扩展了更多的设备和应用接入亚马逊Alexa语音识别平台。

电脑的图形交互第一次改变了世界,而智能手机的多点触控,把移动互联网时代和PC时代彻底区分开来。在更多的设备可以联网时,除了触屏,语音就是被寄予厚望的下一代核心的入口级产品。智能语音助手的意义,在于连接起各种互联网服务,无论是手机还是音箱,不过是载体不同而已。

从微软到苹果,每一个站在时代顶端的企业,都是交互时代变革的引领者。

因此,我们就可以理解众多玩家们的选择。对于巨头们而言,是要建立新的生态平台,承载原有的内容和服务,拓展新的市场;对于中小创业者而言,在这个转折点来临、用户亟待教育、巨头刚刚入局的时刻,需要抢占垂直细分领域场景化赛道,在技术和硬件上占据先发优势。

在这个变革时代前奏响起的时刻,没有一个巨头,愿意放弃这个赌注。在智能机时代一步行差的诺基亚,就是最好的前车之鉴。

尽管Echo已经占据了海外80%的智能音箱市场,Google Home则占了10%。但是,对于中国用户而言,这毫无影响:除了最新发布的苹果HomePod有此可能外,它们并不能进入国内市场。这就为中国玩家们,提供了更多广阔的空间。

2015年,百度就推出了语音助手“度秘”。2017年CES上,度秘研发的开放式人工智能操作系统DuerOS亮相,今年4月,搭载了DuerOS的小鱼在家家庭机器人对外正式开始发售。7月5日,百度发布DuerOS开放平台。

今年4月,腾讯推出了智能语音助手“腾讯叮当”。6月22日,腾讯云的智能服务系统腾讯云小微推出;就在日前,腾讯公司执行董事刘炽平在接受外媒采访时透露,腾讯正在研发一款智能音箱。

在语音助手和智能音箱领域,BAT三巨头再次齐聚。除此之外,今年5月,联想正式推出智能音箱。语音领域的另一巨头科大讯飞早在2014年就曾发布了交互式讯飞智能音箱X1,2015年,京东和科大讯飞成立了灵隆科技,推出了叮咚智能音箱。

“已经是红海了。对于BAT而言,它们最重要的就是布局。”出门问问创始人李志飞曾对黑智如此表述。

但这,仍然没有挡住人工智能领域创业公司们的脚步。2017年,出门问问推出虚拟个人助理,发布问问智能音箱Tichome。“音箱是语音交互很重要的一个使用场景。如果我们的目标是要推动语音交互在消费场景下的落地,我觉得这就是一个不可缺失的场景。我一定要做这个东西。”李志飞对黑智说。

2014年,离开阿里M实验室的祝铭明(Misa)创办了Rokid,今年6月8日,Rokid的第二代智能语音机器人Pebble全渠道上市。还有一个有趣的事情是,据Misa透露,他当初从阿里离任之际,向集团引荐的继任人选正是浅雪。而当年也曾在阿里无线事业部和智能生活事业部负责阿里语音和图像算法团队的翟鲁峰,也创办了问之科技,推出了智能音箱麦宝。阿里,隐然成为国内智能音箱行业的“黄埔军校”。

Rokid第二代智能语音机器人Pebble

既然是款音箱,那么满足用户对音乐的需求才是最重要的。因此,作为内容提供商,酷狗音乐潘多拉和喜马拉雅FM小雅音箱的入场,就也容易理解了。值得一提的是,为小雅音箱提供语音交互系统的,是由猎豹傅盛投资的AI公司猎户星空。

还未真正抢占用户的客厅,这个领域,就已满满地弥漫了硝烟的味道。“深圳南山区一公里以内就有112家公司做语音智能。”据喜马拉雅硬件总经理兼副总裁李海波说。

而一个终极的问题是,究竟谁才能真正占领中国用户的客厅?

这场战争的打法上,百度向左,阿里向右。

学习Google和亚马逊?关键是开发者

既然是要抢占用户空间内的交互入口,成为IoT生态核心,那么,成为“平台”无疑是众多公司的野望。

相比之下,苹果更为注重“音箱”的定义,HomePod秉承了苹果一向高调表示的“高品质、高价位”,并且其音乐主要是依靠Apple Music的4000万首曲库内容支撑。

而在百度和Google身上,我们则可以发现更多的相似之处。尽管百度目前并没有硬件产品,但是,Google Home,同样也并不被认为是Echo的强力竞争者。它的市场占有率还远不及Echo,但在Google的开放生态下,Google Assistant已经覆盖了超过1亿台设备,并且集成了Google Lens的图像处理能力,越来越多的接入终端,提供的庞大数据,正将Google Assistant不断培养成强大的AI服务平台。

在7月5日的百度AI开发者大会上,DuerOS成为其中的核心产品之一,百度度秘事业部总经理景鲲表示,DuerOS就是“人工智能时代的安卓”。DuerOS的目的就是要让每个开发者,都能够以低门槛打造属于自己的智能语音交互设备。甚至搭载了亚马逊Alexa这样语音助手的海外设备,也能通过接入DuerOS轻松入华。

依托17年来积累的数据和AI技术,以及AI大牛们的贡献,百度是准备在此基础上,打造基于百度DuerOS为入口的智能语音生态链。

而谷歌和百度的选择,或许也有无奈之处,那就是,它们不具备亚马逊Echo模式的基因——它们天然并没有产品和服务可以直接接入音箱。

至于Amazon Echo的路线,在技术方面,其关键的7个麦克风阵列,控制在1.5秒内的反应时间,以及接近成本的定价策略,都构成了亚马逊独特的壁垒。

要想挑战Echo,更难复制的,则是亚马逊围绕自己生态建立的商业模式。作为全球最大的网上零售商之一,亚马逊在渠道和硬件产业链、销售、品牌等方面积累起了全方位的优势,Echo在应用上,则可以和亚马逊其他产品和服务相结合,比如,接入亚马逊电商业务以及Kindle和Amazon Music等。基于亚马逊本身产品的频繁的应用场景,增强了Echo用户的黏性,使其成为家庭设备的控制中心。Alexa的开放态度,带来了更多第三方厂商的合作。

而同样作为电商和云计算巨头,阿里无疑是有这个成为中国版“Echo”野心的。

天猫精灵上,同样是接入了阿里的购物、支付、阿里智能联盟的硬件设备等,在开发平台策略上,也更类似Alexa。AliGenie同样是走开放平台路线,和第三方服务对接。在这个平台上,阿里更强调的,是产品未来所能提供的服务能力。和Alexa放在AWS上一样,AliGenie也运行在阿里云上。基于阿里云和YunOS,为智能硬件提供服务,占领家庭控制中心,是阿里一贯以来的想法。

智能语音交互终端虽然已经成为红海,但是语音识别和自然语言理解技术还亟待提高,应用场景还需要更多挖掘,用户使用习惯更是需要培养。前方的坎儿还很多。如何让AI技术和产品在更多的场景里落地,打造更大的生态联盟?阿里和百度选择的,都是走第三方路线,让开发者们,提供更多的可能。

但平台不是你想做就能做的。产品能力、技术底蕴和公司基因,是个很大的影响因素。而阿里在语音识别技术和硬件上的能力,也还有待考验。

李彦宏在AI开发者大会上演讲时说,百度内部在讨论收购事项时,他的同事担心有竞争对手会同时出手,但李彦宏说:“我说,不会的,我们的竞争对手不会收购技术公司,他们只愿意为产品和用户量付费,只有百度愿意为技术付费。”姑且不论其指向谁方,但其中的意思却是很明显的。

语音交互之争,前方还是个未知数。第三方服务商和开发者,已经成为这场未来战斗的重要决定者。