人工智能产业深度观察(一)
2016-06-17 11:03 人工智能 谷歌

人工智能真正意义上第一次大规模商业化的运用是搜索与广告。

什么是人工智能?

人工智能在学术研究领域已经有60年的历史,经历两起两落,产生了很多的理论、算法、模型。通俗的讲,狭义的技术就是对输入的感知,加以学习与训练,使其成为有创造和决策能力的大脑。

有种说法“人工智能,有多少人工就有多少智能”,指的就是这种有监督的学习,即用经过标记的大量数据来训练,语音识别、图像识别、自然语言理解的准确率基本都是依赖这种学习和训练方式来提升的。

更进一步,AlphaGo之所以让业界这么兴奋,是因为它不完全从历史上的所有棋局中去学习,也通过蒙特卡洛树搜索(Monte Carlo TreeSearch)的方法,让机器能够自我对决,从而提升整个系统的棋艺水平,这是进化到了无监督式的学习阶段。

人工智能真正意义上第一次大规模商业化的运用是搜索与广告。

年后互联网上网页数据大量地产生,搜索引擎运用了大量的机器学习以及自然语言语义理解来改善搜索结果关联度;Google和百度的广告系统大量运用了深度学习技术。这些技术应用让搜索引擎及其广告系统造就了一个很好的一个商业模式。

作为见证了互联网与整个移动互联网发展的资深网虫和多年的资深产品架构师,作者分享她对人工智能的理解,以及在这领域内的投资想法。

从生态的角度看待人工智能的发展普及

2007年6月第一代手机问世,拉开了移动互联网发展的序幕,移动互联网进入突飞猛进的高速发展期。苹果不仅仅重新定义了手机的交互方式,更是让一部手机变成了一台移动智能电脑,通话只是它的基本功能,上面的万千的应用与服务背后连着的是成千上万的开发者。

4个月以后公布操作系统的,更是同时宣布与家手机厂商运营商成立开放手机联盟,让运营商和终端厂商都成为手机营销推广的重要渠道。它将用户、开发者、广告商、厂商、运营商都作为产业的力量一起助推发展。短短8年时间,使得全球的亿用户都用上了智能机,中国的亿人用上了智能机,这就是生态的力量。

今天看人工智能,计算能力不断地变强,深度学习技术使数据分析建模能力有了长足的进步,行业的数据也有了积累。预测它真正在用户与行业中的普及使用,可以比较大胆地放在一个生态的角度来看它:

用户接触到人工智能,会是某个场景下的某个载体设备而非虚无的技术本身。把几个行业的例子与智能手机平行看时,会发现当这个设备有智能传感器、当这个设备连着云端、有会连着数据训练学习和决策的人工智能大脑inside时,他们都是智能电脑的变体。

智能手机是可通话的移动智能电脑;

无人驾驶车是可载人的移动智能电脑;

儿童智能动物玩具是可跟儿童玩的移动智能电脑;

儿童智能机器人玩具是可以跟儿童玩的人形移动智能电脑。

这个生态中包括了:

带技术的核心硬件

芯片,为响应人工智能和深度学习的需要,在速度和低能耗方面被提出了更高的要求。

IBM在研制出世界上首个大脑芯片原来的半导体公司英伟达、英特尔、高通纷纷进入;国内的北京君正积极投入,创业型公司地平线机器人获大量投资也进入人工智能芯片领域;刚发布人工智能加速器芯片。总体来说像芯片这种硬件不仅在多个垂直应用领域之间难有统一解决方案,甚至在同一垂直领域中现在也还无统一标准。

传感器之于机器,相当于人的眼睛,有非常高的要求。比如无人车领域的光学LIDAR,直接影响到高精地图的绘制是否准确,基于点云的定位以及障碍物检测是否准确。目前造价昂贵,在市场上能否被精度不错但费用较低地量产,在很大程度上影响了无人驾驶这个领域的发展速度。

操作系统OS

手机上系统是个开源系统,一些垂直领域会直接使用,或者基于IaaS或Linux进行针对性开发;当然某些不需要影视系统的垂直领域也有选择不用操作系统的,比如物联网和智能家居领域。

云平台

IaaS(Infrastructure as a Service):给客户提供云存储、云计算的服务。国际上,AWS是最有名的IaaS服务商,国内也已经有诸多的公司提供IaaS服务,比如阿里云、腾讯云、新浪云、金山云、京东云秦天、七牛、青云、ucloud、浪潮云。存储和计算成本的下降是人工智能机器学习的一大促进因素。

PaaS (Platform as a Service): 给客户提供了比如CDN加速、 统计、推送、社交分享、 测试等诸多服务。除阿里云、新腾云、金山云有提供外,个推、环信等专做某个技术的公司也提供部分服务。

BaaS (Backend as a Service):给客户提供图像标注、人脸识别、文档分类、语音识别、预测模型、情感分析以及模式识别等API,及机器学习预训练模型。

这些云平台为人工智能技术在具体领域的落地提供了基础的后台保证。

人工智能技术(有决策和创造能力的大脑)

有决策与创造能力的大脑=感知+学习与训练,不同方向所需要的大脑能力是不一样的,即对感知层面的技术、学习与训练计算都有差异。另外对这个能力的调用,可能作为API,也可能被打包在整体解决方案甚至硬件中。

App/服务

这层往往会需要调用某些AI能力。在目前这样的发展阶段,结合了行业数据的方向往往容易产生有价值的服务。

外形设备

最终需要落地在OEM设备上。移动互联网基于智能手机;人工智能所对应的OEM设备因垂直应用领域的特征而有具体的表现,因而产业链中谁掌握渠道这个因素也很重要。

某个领域上述生态要素的成熟推动其蓬勃发展。推动力之一为致力于垂直领域内软硬件一体解决方案的公司,比如无人驾驶,从OS到高精地图、到ADAS系统、到硬件传感器,有了突破,形成了完整的解决方案,加上品牌汽车OEM,最终让终端用户真正使用上这个服务。

推动力之二为开发难度的降低,如Android 开发者平台使app开发者有统一标准可以参与开发一样,人工智能的开发工具和相对标准的开源硬件的成熟,若能形成云端智能和终端智能打通的工具平台,普通开发者参与开发难度降低,生态发展会大大加速。

科技巨头的布局

互联网时代,尤其是移动互联网时代,最牛的公司都是拥有生态的公司。

面对新一波的人工智能科技浪潮,研究这些千亿美金以上的科技巨头做的布局,有利于我们发现新趋势。

IBM——是人工智能布局最早的公司,源于没有抓住移动时代,它提前针对下一个时代进行布局。

AI技术:语音语义、深度学习神经网络 (曾收购过AlchemyAPI)

整体解决方案:商业解决方案Waston API(提供了一套完整的API,语音到文本、文本到语音、权衡分析、独特见解、提问和回答、语气分析器以及视觉识别。)

云平台:IBM Bluemix开放云技术平台( PaaS+ 7 种 IBM Watson 服务)、机器学习平台SystemML

硬件:人工智能芯片TrueNorth

产业布局:深蓝计算机;智能机器人(与苹果、与软银机器人Pepper)合作;物联网;医疗服务;VR游戏。

Google-Alphabet——人工智能实力最强大的公司

AI技术:视觉、语音、自然语言、大数据、 神经网络训练+深度学习(曾收购过Dark blue labs、Vision factory、Deepmind、Jetpac、DNNresearch一堆技术公司)

云平台:第二代机器学习系TensorFlow(包括了各种“预训练”模型、自然语言处理、推荐系统、模式识别以及预测功能)

硬件:人工智能加速器芯片TPUs (Tensor processing units)

产业布局:无人驾驶、基于智能手机的各种app应用与插件、智能家具(硬件手表、家具中枢Google Home)、VR生态(Daydream平台、VR头显与控制器、适用的手机。

Facebook

AI技术:视觉Deep face技术(其中收购过face.com)、语音收购过Mobile technologies,自然语义收购Wit.AI、 神经网络训练+机器学习

云平台:开发者平台Parse;在Torch中开源深度学习模块

硬件: Big Sur(基于GPU的用于训练神经网络的硬件系统,开源)

产业布局:语音助手Moneypenny;VR的生态(硬件收购Oclus Rift头盔、能拍照的Sourroud360全景摄像机促进内容发展)

Microsoft

AI技术:语音、视觉、自然语言、分布式机器学习

云平台:Microsoft Azure(存储、计算、数据库、live、媒体功能);分布式机器学习工具包DMTK(自然语言处理,推荐引擎,模式识别,计算机视觉以及预测建模等)

产业布局:语言助手(微软小冰、小娜、Tay)、VR(全息眼镜)

Apple

AI技术:自然语言收购Vocal IQ、收购可视化地图Mapsense\GPS公司 Coherent Navigation

产业布局:汽车领域无人驾驶、SIRI语音

Amazon

云平台:Amazon Web Services(存储、计算、模式识别和预测,其中视频识别API 收购Orbeus)

阿里

云平台(阿里云IaaS强,可视化人工智能平台 DTPAI)

产业布局 :智能家具、物联网

腾讯

AI技术:视觉

产业布局:智能硬件

百度——未在千亿美金公司之列,但在人工智能的布局上不容被忽略

AI技术:语音、视觉、自然语言与智能语义、自动驾驶、深度学习

整体解决方案:基于智能手机的语音服务系统(度秘)

开发者云平台: 百度云

产业布局:汽车领域无人驾驶、基于智能手机的各种app应用与插件。

可以看到:

在人工智能领域软件系统开源是个常态,多家巨头都将自己的人工智能系统开放出来,也已有巨头在硬件开源方面进行尝试,这有利于业内更多的企业和工程师参与人工智能领域的研发,产生更多有价值的研究成果。模型与基础算法并非核心竞争壁垒,结合行业数据的使用才产生巨大的价值。

科技巨头不断通过收购技术与有技术含量的团队,来增加实力。意味着创业公司退出的路径之一是被巨头公司并购。

有实力的巨头旨在建立生态,从AI技术、整体解决方案、云平台,到硬件和产业都有完整的布局。生态之间是独立的,因而最强的巨头间是竞争关系,而上下游的软硬件提供者却有广泛合作关系。广大的开发者可依附于生态做发展。

3

创业机会

从生态发展和大公司的布局来看,人工智能生态尚处于早期阶段。目前两大方向我们是很看好的:

结合行业数据训练后形成的场景化应用

应用于医疗。拍片后的诊断,各种化验单的检验结论,医生根据经验来诊断,历史上已经积累足够多的样本,机器学习后也能掌握这种技能。

应用于金融。风控利用大数据计算,将不同来源的数据结构化地整合到一起,语义化地理解其中的风险点。

应用于零售业。机器学习来预测每款商品在未来时间段的销量,零售商释放库存管理压力。

类似例子不胜枚举。深度学习技术使数据分析建模能力有了长足的进步,行业的数据也有了积累,结合不同的行业数据训练,场景化应用机会非常多。

用核心技术打造人工智能生态中的“生产工具”

垂直领域的整体解决方案。无人驾驶、智能家具、工业机器人、儿童机器人,涉及的生态构成比较长,同时又有巨头公司在布局。其中能解决垂直领域中的核心问题从而产生可应用的整体解决方案的公司,将是很伟大的公司。

关键技术点突破。图像、语音、自然语言语义、人机交互等。

核心硬件的突破。新的有技术含量的关键硬件的崛起。比如同一垂直领域中统一标准的传感器,像降低造价的LIDAR。

BaaS服务,比如结合行业数据训练后形成的算法应用进一步形成垂直行业的场景标准化智能产品,服务于客户与开发者。

总体而言,在能使得开发难度大大降低的云端智能和终端智能打通的工具平台与生态成熟之前,这个领域的创业机会只属于有技术能力的团队。