一篇文章告诉你百度人工智能全貌
2017-04-06 11:13 百度 人工智能

承载了百度转型重任的人工智能,现在终于到了“秀肌肉”的阶段。

本文系科技唆麻(ID:techsuoma)授权i黑马发布 作者唆麻。

刚刚结束的IT领袖峰会上,百度出人意料的赢得了舆论的空前优势:从清华大学国家金融研究院院长朱民、到微软全球执行副总裁沈向洋,再到传统互联网三巨马头化腾、马云、李彦宏,无一例外的都在谈论人工智能。

作为中国互联网公司中下注最重的百度,李彦宏的发言某种程度上有给人工智能行业定调的意味在里面,连马化腾在台上都不得不承认:“在人工智能领域,Robin(百度)走的更靠前,腾讯还是落后不少的,去年才刚刚成立这个部门“。

李彦宏在台上说,人工智能是一个非常大的产业,会持续很长时间,在未来的20年到50年都会是快速发展的,“人工智能虽然不能超越人类,但是当它能够逼近人类的时候,就会逐渐颠覆掉各个行业。”

李彦宏还表示,百度今年会加速人工智能商业化和落地,这意味着,承载了百度转型重任的人工智能,也到了“秀肌肉”的阶段。

本文将从两个方面,技术层和产品层去一窥,百度的人工智能全貌,同时也尽量用最精炼的文字,让大家了解,百度所大力推动的人工智能,究竟发展到了什么阶段。

技术:人脸识别、语音识别优势突出

人工智能是一个很宽泛的概念,具体来说,人工智能包括机器人、语言识别、图像识别、自然语言处理和专家系统等分支领域。而百度基本上覆盖了人工智能所有主流的分支领域和流派。

因此,在谈论之前,我们可以先明确一下,我们所谈论的人工智能,是基于深度学习的监督式学习,也是目前主流深度学习流派,即用AI来确定A-->B的映射——即输入A,响应B,这个映射过程中涉及到两个,一的匹配的数据集,二是大的神经元网络。因此,现在AI团队基本包括机器学习和高性能计算两组人,百度AI团队里的这两种人员都专注于各自领域。

图像识别

图像识别可以分为文字识别、图片识别、人脸识别、作为百度重点发展的领域,百度在这一块取得的突破还是很大的。

目前百度人脸识别技术则可实现72个人脸特征点检测和实时追踪,识别准确率达到99.77%。

以百度人工智能参加《最强大脑》时举例来说,当时百度人脸测试集有2百万人的2亿张图片作为训练样本数据,而在比赛中也运用到了跨年龄人脸识别、声纹识别、动态性人脸识别和弱光带遮挡情况下的人脸识别技术等识别技术。

图片识别这块,百度已经做到了能在100毫秒内分析用户上传的菜品图片,寻找区分菜品和库里图片的视觉特征。对于美食图片的识别率已经达到90%,不仅能够区分宫保鸡丁和酱爆鸡丁这种高相似度的菜品,还能生成卡路里提示、智能化情感评分等。

除了菜还有狗,此前在中国联通合作伙伴大会高峰论坛上,李彦宏公开表示:“百度有的图像识别技术,可以识别出来三百多种不同品种的狗。

语音识别

语音技术分为语音识别、语义解析、语音合成三种技术,不捧不黑,目前百度在语音识别上处于业界领先地位。

百度语音在安静环境下普通话语音识别准确率已达到97%,超过正常人的听力水平。《财富》杂志曾在2016年公开发文,介绍百度语音技术公开专利数量达到404项,占国内智能语音公司公开专利数量的57%,并被《MIT Technology Review》评为“2016全球十大突破技术”。

此外,百度硅谷研究院在过去几年开发了Deep Speech技术,不同于传统的语音识别系统。Deep Speech完全运用了深度学习技术,通过成百上千小时的语音数据训练后,实现对语音的识别。

去年10月,百度上线了一款名为TalkType的手机输入法应用。这一应用便是基于Deep Speech的技术,这款应用键盘可以让你用语音作为主要的输入方式。按住麦克风说话,然后用手指选择对于的词或句子,摒弃了传统输入法将语音作为辅助的定位。

今年3月百度宣布推出SwiftScribe网页应用,将改变完全依赖人工的速记行业现状。该网页应用背靠百度深度语音识别系统,将音频文件转为文本,转化效率较人工速记快 1.67倍。

百度除了图像和语音之外,还有正在研究的领域和技术,在《麻省理工科技评论》发布2017十大突破性技术,强化学习、自动驾驶货车、刷脸支付等人工智能技术上榜,百度入围多种技术提名,包揽人工智能所有奖项,成为今年上榜最多的中国公司。但鉴于篇幅有限,在这里不进行展开。

从1980年2017年,AI有很大的发展,尤其是在语音和图像识别领域。可以预见的是,在接下来的时间里百度将率先在这几个领域取得重大突破并实现快速落地,但这并不意味着百度在技术上一家独大,创业公司没有任何机会。事实上,在唆麻看来,人工智能创业公司依然可以在法律服务、医疗影像这些领域取得成功。

但公允的是,即便是百度投入如此大的人力和财力去研究图像识别和语音识别技术,但依然难度很大,这也是为什么创业公司不要轻易”入坑“的原因:人工智能门槛高,甚至会陷入停滞不前的地步,正如 Peter Norvig 在去年 EmTech Digital 数字峰会上说到的:采用工程方法去做机器学习是非常困难的,因为AI系统中的错误很难被核验、校准、修复。

产品层:国外有的百度都有

百度的人工智能是目前中国所有互联网公司中覆盖产品最多的,虽然和世界一流的互联网公司相比,比如谷歌、微软、IBM,百度仍有差距。但国外现有的人工智能产品,百度全部都有,因此在某种程度上,百度相当于扛起了中国人工智能的大旗。

无人车

百度从很早就开始入局无人车项目,并且将无人车单独成立一个事业群组IDG(百度智能驾驶事业群组)。早在2015年底,百度无人车就实现了城市道路、环路及高速道路混合路况下的全自动驾驶。2016年9月,百度获得在美国加州无人车自动驾驶路测牌照。

DuerOS

自2015年推出以来,目前DuerOS已经具备语音唤醒、语音播报、应用控制、感情陪伴、链接3600行、索引全网信息、日程管理,7大类目,70+功能。

DuerOS对于百度的意义重大,李彦宏多次为其站台,可见其重视程度,而智能语音助手这块,不光百度在做,也有一些创业公司涉足,比如出门问问。

DuerOS对标的是就是亚马逊的无线智能音响Echo,Echo搭载了智能语音助手Alexa,可以通过语音对话和控制,比如”帮我打开灯。”随后,这款本不被看好的产品迅速占领了市场。据研究机构Strategy Analytics估算,亚马逊在2016年卖出了630万台Echo,而今年这个数字将继续增长。

DuerOS是百度推出的对话式人工智能操作系统,目前DuerOS已经具备7大类目70多项能力,支持手机、电视、音箱、汽车、机器人等多种设备,实现语音控制、日常聊天、O2O服务等功能,同时支持第三方开发者的能力接入。

事实上,Echo搭载的就是其Alexa人工智能操作系统,并且具备扩展的能力。亚马逊Alexa首席科学家Nikko Strom还表示,不只如此,Fire TV、Fire平板电脑,还有其他一些第三方设备上,也可以下载到内建Alexa技术的产品。亚马逊提供了声音识别技术植入它们的API,连手表都用我们的技术。

如果非要找一个对标的产品,那么DuerOS的竞争对手就是Alexa,DuerOS对于百度的意义非常重大。因为这是百度第一次通过底层系统去向行业输出自己的一套标准,因此DuerOS也被国内外同行称为“具有划时代意义的对话式人工智能操作系统”。

在这里再多说一点,可能大家都没有怎么注意,但DuerOS已经在国内向行业渗透并跨界合作。

DuerOS与中信国安广视达成战略合作推出智能电视机顶盒,用户可通过语音对话实现查找影片、搜索资料、点播、天气查询、预约提醒等服务。

百度与小鱼在家达成合作,小鱼在家的家庭机器人将搭载百度DuerOS操作系统。

百度DuerOS宣布与海尔、美的两大家电巨头合作,将DuerOS对话式人工智能操作系统搭载到冰箱,可实现语音控制、食材管理、聊天娱乐等智能功能。

百度输入法

百度输入法的人工智能主要在两个方面,一是基于语义分析,二是是基于百度数据挖掘和中文分词技术。从理论上说,输入法是绝佳的学习场景,输入法能够通过大量的语言、语义的学习,更加了解人的性格、思维、文化等,可以更快捷、更准确地读懂人类语言。去年8月份百度发布了输入法4.0版本,进一步强化了智能输入的概念。

小度机器人

小度机器人是百度推出的首款智能硬件机器人,最早于百度世界大会亮相,当时李彦宏和小度还在现场展示了订餐和订咖啡等功能。小度主要功能包括自然语言理解、智能交互、语音视觉,应该这么说,小度集成了百度现阶段人工智能绝大多数的技术和产品。

小度最为公众所熟悉的,应该是是在江苏卫视的《最强大脑》第四季,以3:2的比分战胜了人类“最强大脑”王峰。不过小度在第四季第二场比赛中,接下来,小度战平听音神童孙亦廷又以2:0的比分在人脸识别中战胜了王昱珩。虽然还没达到百战百胜的地步,但也在一些领域凸显了自己的实力。

医疗大脑

医疗领域是人工智能的必争之地,不光是百度,IBM和阿里也纷纷入局,比如IBM推出了IBM Watson Health,阿里也在前几天发布了ET医疗大脑。

百度的医疗大脑是百度大脑在医疗场景中的具体应用,百度医疗大脑是通过海量医疗数据、专业文献的采集与分析进行人工智能化的产品设计,模拟医生问诊流程,与用户交流,依据用户症状提出可能出现的问题,并通过验证给出最终建议。

AR

大家可能被之前百度做一些AR营销case吸引过,比如复原老北京老九门,但百度的AR主要研究的是图像识别、三维感知与跟踪、人机交互、三维渲染与虚实融合等多个环节的配合。从产品来说,百度推出针对开发者的AR开放平台Du Mix,包含AR SDK和AR编辑器。

在今年,百度也成立增强现实实验室,这也是继人工智能实验室、深度学习实验室、大数据实验室之后的第四个实验室。

百度人工智能架构

从公司架构上更容易宏观的看清楚一个公司的战略和动向,唆麻发现,百度对人工智能的投入,不仅仅是人力、金钱、资源上的倾斜,而是在整个架构体系上,从一家互联网公司,慢慢向一家面向人工智能的公司慢慢转型。在陆奇加入百度后,百度关于人工智能的调整也更加清晰。

2017年2月,百度宣布将度秘上升到度秘事业部,百度高级总监景鲲和首席架构师朱凯华将担任事业部的核心管理层,直接向百度集团总裁和首席运营官陆奇汇报。

此外,百度还于今年正式成立了增强现实实验室,目前百度深度学习研究院目前有人工智能实验室一共有四个,硅谷人工智能实验室、深度学习实验室、大数据实验室以及现实增强实验室。

与此同时,百度宣布成立智能驾驶事业群组,将自动驾驶事业部、智能汽车事业部、以及2015年1月推出的Car Life etc车联网业务通通合并到智能驾驶事业部,以及AI技术平台体系(AIG)。新的百度AI体系包括了NLP、KG、IDL、Speech、Big Data等在内的百度核心技术,全面负责有关业务的王海峰也同时晋升为Estaff成员。

百度最新的五大事业群组中,大搜、AI技术平台体系、新兴业务事业群组、智能驾驶事业群组、金融服务事业群组,已经有两个和人工智能相关。

百度的人工智能大事记

最后给大家一个福利,关于百度人工智能的大事记,不能保证100%覆盖,但基本上涵盖了百度人工智能过往的重大节点。

2013年,百度深度学习研究院成立

2014年1月,百度少帅计划启动

2014年5月,百度硅谷人工智能实验室成立

2014年5月,吴恩达加盟百度研究院,担任首席科学家

2014年12月,百度宣布开发出Deep Speech深度语音识别系统

2015年9月,百度推出机器人助理“度秘”

2015年12月,百度硅谷人工智能实验室开发出Deep Speech 2

2015年12月,百度完成无人驾驶汽车混合道路上路测试

2015年12月4日,百度自动驾驶事业部正式成立,计划完成无人车三年商用、五年量产

2016年8月15日,百度投资激光雷达公司Velodyne LiDAR

2016年11月16日,第三届世界互联网大会上,百度技术亮相乌镇,包括无人车体验试坐、人脸闸机,百度大脑也获得“世界互联网领先成果”奖项。

2016年 12月21日,度秘与中信国安广视达成战略合作。

2017年1月5日,国际消费类电子展(CES),百度发布对话式人工智能操作系统DuerOS发布,并与北京小鱼儿科技有限公司达成深度战略合作。

2017年1月17日,陆奇加入百度,担任百度集团总裁兼首席运营官、百度董事及董事会副主席,并兼任百度智能驾驶事业群组总经理。

2017年3月2日,“深度学习技术及应用国家工程实验室”成立。

2017年3月10日,百度与海尔、美的等家电厂商宣布,将共同推出基于DuerOS操作系统的智能冰箱产品。

2017年3月30日,百度发布了首款搭载了DuerOS对话式人工智能操作系统的智慧芯片,并宣布与紫光展锐、ARM、上海汉枫达成战略合作。