会下棋、会猜脸、会德扑,无所不能的人工智能到底是什么?
2017-01-11 09:04 AI 人工智能

机器学习(ML)是人工智能的一部分。

本文由华创资本(微信ID:ChinaGrowthCaptial)授权i黑马发布

“在过去的十年里,我们生活在移动互联的时代里,但在接下来的十年中,人工智能将统治这个世界。”————Sundar Pichai(谷歌首席执行官)

2017刚刚开年,人类在和人工智能(AI)的PK中连连败退:化身“Master”的AlphaGo对中日韩顶级棋手实现全胜、吴恩达博士率百度大脑在人脸识别上完胜“最强大脑”选手,最新的新闻是:机器已经在一对一的无限注德州扑克中赢过人类。

百度首席科学家吴恩达(左)率队的百度人工智能在人脸识别跨年龄识别任务中击败《最强大脑》

据来自加拿大和捷克的几位计算机科学研究者近日在 arXiv 上贴出论文显示,一种用于不完美信息(例如扑克)的新算法DeepStack,通过使用深度学习技术从单人游戏中自动学习有关扑克玩法。研究者在论文中称,在一项有数十名参赛者进行的44000手扑克的比赛中,DeepStack 在一对一无限注德州扑克中击败职业扑克人类玩家。

为什么人工智能在短短时间内连续出现了堪称革命性的突破?为什么在20世纪50年代便提出了的人工智能的概念,在今天这个时代下才真正崛起?为什么从亚马逊、Facebook到谷歌、微软,世界上几乎所有具有影响力的科技公司似乎都对人工智能抱有极大的兴趣?到底什么是人工智能?为什么它这么重要?当人工智能这一话题在人群中流传开时,却只有小部分专家理解其真正含义。

因此我们将会从“人工智能”的意义以及一些如“机器学习”这样的关键术语入手,来阐述“人工智能”代表的基本含义和所代表的巨大价值。

什么是人工智能?

1. 人工智能

“人工智能”在1956年被达特茅斯大学助理教授约翰·麦卡锡率先提出,指的是软件与硬件在其运行时展现出来的智能行为,用麦卡锡教授的话来说,即“制造智能机器的科学和工程,尤指智能计算机程序。”

事实上,基本的“人工智能”已经存在了很多年,通过基于特定规则的程序来“智能地”解决一些问题的方式早在很多年前就开始使用,然而这种智能技术的发展却一直很有限,因为对于很多现实问题来说,想通过手工编制算法的方式来解决实在太过复杂了。

这些复杂现实问题包括医疗诊断、预测是否机器会出故障、测量某些资产的市场价值等等,这类问题都涉及成千上万的数据集和变量之间的非线性关系。在这些情况下,我们很难用数据去实现最佳预测效果。

当然例子还有很多,包括识别图象中物体、翻译语言等方面,我们甚至无法制定规则来真正准确地描述我们所需要寻找的特性,就好像我们似乎永远不能指定一套能在所有情形下都准确地描述一只狗的外貌的规则。

那我们是否能将做复杂预测的难点———数据优化和功能规范交给程序本身去思考,而不是交给程序员去思考呢?这就是现代人工智能所需要做到的。

2. 机器学习

机器学习(ML)是人工智能的一部分。所有的机器学习必然是人工智能,但并不是所有的人工智能都是机器学习。机器学习技术近年来进步显著和迅速,如今我们对人工智能充满兴趣实际上也就是对机器学习充满兴趣。机器学习技术利用算法来解决一些问题,来达到减轻人类在面对一些难以解决问题时负担的目的。

就像人工智能先锋亚瑟在1959年写道,是机器学习的研究才使得电脑从此拥有了学习能力,而不是一味的显示地编程。大部分机器学习的目标都是针对一些特定的现实情况来开发一个预测引擎。譬如,某个算法有一些有关某一领域的信息作为输入信息(比如一个人过去所看过的电影),然后该算法根据输入信息做一个有根据的预测(比如在未来人们喜欢不同电影的概率)。给予电脑“学习的能力”,准确地说也是给算法一个取得最优解的任务,使得程序能在权衡众多多变的数据之后能对未来有一个准确的预测。有时我们甚至可以走的更远,比如撇开程序部分而将说明物体的特性放在第一位。

机器学习算法通过反复训练的方式进行学习,算法首先会接受一些结果已知的事例,然后记录下自己所做预测与正确输出之间的差距,再通过协调不同输入数据的权重的方法来提高自己预测的精确度,直至达到最优预测水平。因此,机器学习算法的定义,就是通过不断的练习来提高预测质量。我们提供的数据越多,我们所做的预测引擎就会越棒(如下图中的图2与图3)

目前有超过15种机器学习的方法,每种都有着其独特的算法结构去利用所给数据做出最优预测。其中“深度学习”(Deep Learning)这种方法在新领域带来了突破性的结果,最有效的机器学习算法还包括:

“随机森林”(Random forest),通过创造众多决策树来实现最优预测;

“贝叶斯网络”(Bayesian networks) ,通过概率方法分析变量和他们之间的关系;

以及提供分类示例并创建模型以将新输入分配给其中一个类别的支持向量机(SVM)等等;

每种方法都有其优点和缺点,对于特定的问题,算法的选择取决于可用数据集的性质等因素。在实践中,开发人员通过实验来发现什么是最有效的。

根据我们的需求和想象选择不同的机器学习案例。使用正确的数据能够利用算法达到很多目的:根据一个人之前的购买经历来建议购买者喜欢的产品,预测汽车装配线上的机器人何时失效,预测一封电子邮件是否发送错误,估计信用卡交易是欺诈的概率等许多案例。

3. 深度学习

即使我们有了综合的机器学习方法,对于某些情况我们依然难以写出执行其任务的程序,比如理解语音信息和识别图象中的对象。为什么?因为我们无法以一种实用可靠的方式指定要优化的功能。

例如,如果我们想编写识别汽车图像的计算机程序,我们不能为程序描述在所有情况下汽车的特征,因为这涉及到汽车的形状、大小、颜色、方向、姿势以及背景、照明和无数其他影响对象外观的因素。这之中需要考虑的变量太多,即使我们能够编写出一组这样的识别规则,不能适用于所有的情况则同样没有意义。我们需要为我们想要识别的每种类型的对象编写一个程序。

然而深度学习法彻底改变了人工智能的世界。深度学习是机器学习的一个子集,却位于15种方法之上。所有深度学习都是机器学习,但并不是所有的机器学习都是深度学习(图4)。

深度学习这一方法是有效的,因为它摆脱了程序员必须规范化地描述事物特征或者必须优化数据的桎梏,而算法是用来完成这两件事。

那么这是如何实现的呢?突破点在于深度学习法模拟的对象是大脑,而不是世界。我们自己的大脑学会做困难的事情——包括理解言语和识别对象——不是通过处理穷举规则,而是通过实践和反馈。作为一个孩子,我们体验世界(例如我们看到汽车的图片),作出预测(“车”)和接收反馈(“是的”)。尽管没有一套详尽的规则,但是我们可以通过训练不断学习。

深度学习的原理与此类似。人工的、基于软件的计算机们就像大脑中的神经元一般被紧密地链接在一起,形成一个电子的“神经网络”。 如果输出是错误的,神经元之间的连接由算法调整,这将改变未来的预测。 最初网络将错误多次。 但是,当我们在数百万的调整事例中,神经元之间的连接将被不断修改,最后才能让神经网络在几乎所有的场合做出正确的决定。 实践使预测几近完美。

随着效率的提高,我们现在已经可以使用这个过程:

识别图片中的元素;

实时翻译语言;

使用语音来控制设备(比如Apple的Siri,Google Now; Amazon Alexa和Microsoft Cortana);

预测遗传变异如何影响DNA转录;

分析客户评论中的情绪;

检测医学图像中的肿瘤以及更多疾病;

但深度学习并不适用于所有的情况,它通常需要大量的数据集进行培训以及广泛的处理能力来训练和运行神经网络。同时它有一个显而易见的问题——人类可能很难知道神经网络如何自行开发其预测。但是通过从复杂的特征规范中释放程序员,深度学习已经为一系列重要问题提供了成功的预测引擎。 因此,它已经成为AI开发人员工具包中的一个强大的工具。

为什么说AI很重要?

AI是重要的,因为它解决了很多困难并且深远的问题,并且解决这些问题的方法同样可以应用于许多对人类有益的方面——包括健康、教育、商业、公用事业和娱乐等领域。自20世纪50年代以来,人工智能研究集中在五个领域:

推理:通过逻辑推理来解决问题的能力

知识:表达对这个世界的认知的能力

规划:设定和实现目标的能力

沟通:理解书面和口语的能力

感知:从视觉图像,声音和其他感觉输入推断世界的事物的能力

AI是有价值的,因为在许多情况下,在AI方面的进步给人类社会带来的更多的是革命性的而不是进化性。

在未来几年,机器学习能力将应用在几乎所有部门的各种各样的过程中,随着时间的推移,我们希望机器学习的应用会变得越来越普世化,机器学习技术将会成为开发人员标准工具包的一部分,并且在不断地改进过程中实现质的飞跃。

人工智能的未来?

机器学习将带来的好处是众多的,同时也是重要的。许多有利的应用将会很直观,比如自动驾驶车辆和人机交互的新技术。但也有许多的应用将不太明显,不过同样能够提供更有能力和更高效的日常业务流程和消费者服务。

与任何改革一样,有时人们的期望将超过其本身的短期潜力。我们预计未来某个时候将会出现一段人们对于人工智能的前景幻灭,但随后人们将持续地认识到其价值,因为机器学习不仅仅用于改进现有系统,同时也能重新构思现有系统。

历史上,工业革命通过新的电力和传输来源改变生产和通信方式。 今天,随着软件逐渐统治世界,我们价值创造的主要来源则是对信息的有效处理。通过使我们能够更智能地做到这一点,机器学习将同时带来微小却具有历史意义的益处。

参考资料:

1. AI 首次在德州扑克战胜人类职业玩家,新算法让机器拥有“直觉”  |  新智元

2. 吴恩达率百度大脑完胜“最强大脑”王峰,AI技术解密  |  新智元  作者:胡祥杰

3. The fourth industrial revolution: a primer on Artificial Intelligence | medium  作者:David Kelnar