盘点 | 7个人工智能的常见误解与背后真相
2016-10-09 17:33 人工智能

对于机器代替人类的谣传,事实正相反,人工智能是关于机器增强人类。

如果你是一名职业经理人(只要不是一名数据科学家或者机器学习的专家),你可能早已深陷在主流媒体对人工智能铺天盖地的宣传中。或许你已经看过了《经济学人》(The Economist)和《名利场》(Vanity Fair)刊登的有关人工智能的文章,也了解了有关特斯拉自动驾驶的故事以及霍金与其他名人阐述人工智能会对人类产生的威胁;或许,你还看了Dilbert对于人工智能和人类智能的玩笑...

但作为一名有远大理想的职业经理人,这些人工智能的宣传应该会引发你对以下两个问题的思考——

人工智能到底有没有商业潜力?

怎么把人工智能应用到自己的生意当中?

第一个问题的答案毋容置疑是肯定的。今天的商业已经可以应用人工智能代替人类完成一些工作,人工智能还可以在人力工作上增加上百倍效力,成本却减少到了原来的90%。

第二个问题的答案可能需要更长一些。首先,我们必须破除一些主流媒体的宣传所产生的有关人工智能的谣传。一旦我们粉碎了这些谣言,我们就可以很清晰地了解如何有效的把人工智能应用到自己的工作当中。

误解1:人工智能是魔法

许多媒体都把人工智能描绘的魔幻而神秘,我们只能在一旁为那些像伟大的魔术师一样的科技巨头公司欢呼庆祝,如谷歌、Facebook、苹果、亚马逊和微软等。但其实这样的宣传是不对的。我们要想人工智能应用到商业中,至少要让公司的执行者和决策者理解它。人工智能不是魔法,它是数据、数学、模式与迭代。在将人工智能应用到商业前,我们必须了解清楚人工智能的3个相互关联的关键概念:

训练数据(Training Data, TD)

训练数据是机器学习所用的原始数据集。训练数据有一些输入和预设的输出,所以机器学习模型能对任何一个给定的输出寻找其中的模式。举个例子,输入信息可以是客户和客户与公司代表之间的邮件。输出是从1到5的分类标签,这些标签可以根据公司内部的需要来制定。

机器学习(Machine Learning, ML)

机器学习是一种能从训练数据当中学习模型的一种软件,它还能把这些模型运用到新的输入数据上。举例来说,一封新的邮件从客户发送给公司代表。机器学习模型可以预测邮件的分类,并且说明预测的准确率。机器学习的关键特点是它可以学习而不是应用固定的规则,它可以消化新的数据来调整它的方法。

人机回圈(Human-in-the-loop, HITL)

人机回圈是人工智能的第三个核心,我们不能指望机器学习模型从不出错。一个好的模型大概只有70%的准确率,所以当置信率太低的时候你需要人为介入去解决问题。

因此,请不要被人工智能是魔法的谣言所欺骗,在此基础上,你可以心中有一个人工智能的核心公式——

AI = TD + ML + HITL

误解2:只有科技精英才能使用人工智能

媒体经常暗示,只有亚马逊、苹果、Facebook、谷歌、IBM、微软、Salesforce、Tesla和Uber这样的科技巨头才能主导人工智能,因为这些大公司能组建大型的机器学习专家团队以及投资1亿美元进行相关的研发。但这样的说法是错误的。

今天,花费不到10万美元去应用人工智能是十分现实的。如果你是年收入超过5千万美元的美国公司的一员,那么你只用花费0.2%的年收入就可以应用人工智能,而这样的公司在美国达到了26000家。

所以,人工智能不是专属科技巨头,它对每一个行业都适用的。

误解3:人工智能只为了解决亿万美元级的新问题

媒体们总是爱讲把人工智能应用在自动驾驶汽车或者自动送货无人机这样的大项目上。由于赢家通吃的心理,像谷歌、Tesla和Uber这样的公司正将数亿美元投资在无人驾驶汽车这样的领域。这种宣传很容易让人们产生人工智能只是为了解决数十亿美元问题的印象,但这是一种错误的想法。

人工智能也可以解决百万美元级别的问题。举例来说,任何一个行业最核心的都是了解顾客,这一点对古希腊和古罗马在集市进行交易的人们适用,对今天在互联网进行大规模交易的人们来说也是适用的。对于企业来说,顾客的使用数据和反馈是一座巨大的宝藏。人工智能正是处理这些数据和反馈的有效方法。

所以,人工智能不仅仅是解决像无人驾驶这样的新问题,它也是能解决百万美元级别的实际需求,比如它就可以用在更好地理解用户意见和社交媒体的反馈分析上面。

误解4:算法比数据更重要

主流传媒经常报道机器学习的算法是人工智能所有要素中最重要的一环,他们常常把算法比作是人类的大脑,而且他们认为越来越精密的算法将终究超过人类的头脑。国际象棋与围棋正是机器打败人类例子。媒体尤其关注深度神经网络和深度学习,以及机器做决策的方式。

这样的报道可能会让打算使用人工智能的公司认为找一些机器学习的专家来制定完美的算法是最重要的。但是,如果一个公司仅仅找了算法专家,而没有配套的高质量、大容量的定制训练数据的话,期望往往就会和最终的结果产生巨大的偏差(有完美的算法但是只有60%的正确率)。

例如,从微软、亚马逊、谷歌这样的公司购买机器学习服务而却不打算对训练数据进行投资,就好比买一辆车却从不去加油站一样,你只是花钱买了一堆废铁。另外和汽车加油不同的一点是,用越来越多的训练数据可以得到越来越好训练结果,就好比汽车每加一次油他的油耗就变得更少一样。所以说,训练数据对于人工智能的作用是比汽油对于汽车的作用更大的。

总结为一点,就是训练数据的数量与质量至少是和算法同等级重要的,请确保你对训练数据留出充足的预算并且做好计划。

误解5:机器 > 人类

无论是《终结者》里的施瓦辛格,还是《机械姬》》(Ex Machina)里的智能机器人伊娃,近30年来媒体总是愿意说明人工智能或者机器比人类更好更强。这一点是可以理解的,因为他们想把机器和人类对立起来然后看看哪一方会笑到最后。但是这种宣传往往是和事实有很大偏差的。

比如最近就有一些报道声称谷歌的DeepMind/AlphaGo打败了李世石就是机器战胜了人类,这样的说法明显是与事实不符的。更准确的说法是机器加上众多专家战胜了李世石一个人。

机器与人类拥有不同的能力

打破这一谣言的核心是机器与人类拥有互补的能力。看一下上面的图片,机器非常擅长解决结构性的计算问题,它们能很好的找到特征向量却不能很好的区分哪一个是豹纹连衣裙。人类擅长辨别含义与语境,人类可以一眼就找到豹纹连衣裙却在计算特征向量这样的问题上远不如机器。

所以在商业环境下对机器>人类这一问题的正确理解是机器和人类是互补的,人工智能是人类与机器一同工作。

误解6:人工智能是机器取代人类

媒体为了吸引注意力,常常构想一些反乌托邦的未来。这些想法可能会成为现实,但是他们总是扭曲机器是如何与人共存的。

例如,一个商业中对支持票分类的问题(Support Tickets,指客户针对一些问题对客服发送的信件或电子邮件)。对于今天的绝大部分企业来说,是100%人工分类来解决问题的,这一过程效率低下而且成本很高。想象一下,现在有一个分类模型对10000张支持票分类,结果是70%的正确率,这样的正确率明显是难以接受的。

此时就需要需要人机回圈(HITL)的参与,先设定置信率95%的门限指标然后只接受达到这个指标的输出结果。人类对一些训练数据所加的标签会帮助机器进行学习和改进,经过一段时间的训练,机器就可以逐步的提高准确率,企业也能增大支持票分类的数量直至达到良好使用。

通过人与机器的协作,企业可以在保持质量的前提下提升工作量与工作效率,减少单位经济成本,这些优势都是企业发展的关键要素。

其实,对于机器代替人类的谣传,事实正相反,人工智能是关于机器增强人类。

误解7:人工智能 = 机器学习

最后一个有关人工智能的误传是人工智能与机器学习是同一个事情。这样的谣言会让那些从微软、亚马逊、谷歌那里购买了服务的公司误认为有了机器学习就已经能将人工智能应用到产品上了。

你需要训练数据与人为干预才能让机器学习成为可能的人工智能解决方案,没有了训练数据的模型就像汽车离开了油,昂贵但是又毫无用武之地。没有了人为干预,结果常常会很不理想,你需要通过干预提升预测的准确率。

因此,如果现在你已经对人工智能的商业应用有了基本的认知框架,就可以用人工智能的7个正解取代上述7个误解。

正解1:人工智能=训练数据+机器学习+人机回圈

正解2:人工智能对每一个行业都适用

正解3:人工智能也可以解决百万美元级别的商业问题

正解4:算法并不比训练数据的数量和质量更重要

正解5:机器与人类是互补的

正解6:人工智能是机器增强人类

正解7再一次的,AI = TD + ML + HITL