得数据者,未必得天下
2019-02-14 18:55 数据 信息经济

2得数据者,未必得天下

也许在互联网野蛮拓荒的时代,数据或许可以等同于石油。

包括英特尔前任CEO Brian Krzanich、中国投资大师李开复、硅谷明星投资人Ann Winblad在内的一系列市场的引领者们表示,拥有最大量数据的企业能实现对竞争者的可观优势,把后者甩的远远的只能在后面吃灰。毕竟,从亚马逊到谷歌母公司字母表到脸书,这些数据巨头的市值证明了,数据是新时代的石油。

也许在互联网野蛮拓荒的时代,数据或许可以等同于石油。但随着电子商务的不断发展,这个观点过时了。时至今日,还相信海量数据就可以保证对竞争对手的优势的公司,随时都可能丧失优势地位。

相比石油而言,数据更像是一种润滑剂,而不是燃料。就像发动机需要润滑油一样,人工智能的确需要现实世界照片和信息进行训练和分析,也时不时需要补充一些新鲜数据。但这不意味着只要加入更多的数据,人工智能能力就会越强。想产出更多马力,加润滑油影响不大,得换更好的发动机。科技巨头保持优势所依赖的不是海量的数据,而是永不停息的产品开发和优化。

普遍认为,在2006年,英国数据科学家Clive Humby首先指出数据是信息经济环境下的关键能源。这个比喻在很多地方不贴切。不像石油,数据比特是用不完的,不光如此,随着时间推移数据可能变得越来越有用。相比不可再生的石油,数据是绝对可再生的。

最关键的区别在于,数据是大宗商品而不是稀缺资源。

在2000年代早期,想收纳大量信息的公司首先必须准备成吨的数据储存设备。等到Humby先生提出这个比喻的2006年,亚马逊推出了AWS云服务,让每个接入互联网的用户都能低门槛使用数据储存空间。今天的初创公司可以以低廉的价格在十几家云服务商里挑着用,只需要一个网页就可以大批量处理数据。同时,研究者们也在构筑包括ImageNet的1400万张照片,Linguistic Data Consortium的6.3万条英文口语句子在内的公用数据组。

当然,互联网巨头在数据上还是有优势的。他们有天文数字般的用户和按需求优化调试的巨大云网络。在数据密集行业,先拔头筹并不意味着能够保持优势。

比如苹果公司2011年推出的Siri是首款消费级人工智能在2011年实现声控计算,可以说是工程学奇迹了。Siri收集到海量用户语音数据和对人工智能回应的数据。却只在三年后被亚马逊的Alexa比了下去。

Alexa超越Siri靠的不是更多的数据,而是亚马逊开发出了不用动手就能和电脑交互的方案。“Hey Alexa!”让用户可以便捷地同这款人工智能助手交流。亚马逊将Alexa开放给其他企业,形成了从智能灯泡到智能汽车在内的Alexa生态链,进一步边缘化了Siri。

那么亚马逊从这个生态系统中收集到的信息能保障它的长期优势么?这可没准。谷歌在Alexa两年后推出的人工智能助手不仅能识别语音命令,还能基于其独有的知识图系统,不仅回答问题还附上来源链接。根据市场调研公司Strategy Analytics数据,相比去年,亚马逊在智能助手领域的市场份额下降1/3,谷歌的份额则将近翻番。

在第二季度,亚马逊仍以42%的份额引领智能助手市场,谷歌占有28%,谁也不能断言亚马逊的领导地位能保持多久。

同样的故事不断的上演。大疆的无人机飞行数据不能在同Skydio的竞争中保护它,Skydio开发出了更好的算法来规避障碍物。Uber从司机、乘客和行车路线中收集的成吨数据也没让它在同Lyft的竞争里保持优势。脸书的快照覆盖了地球1/3的人类,还是得早早的买下Instagram来解决潜在的对手。这也不是本世代的新鲜事儿,1998年新兴的谷歌就轻松的击败了拥有更多网页数据的老牌搜索引擎雅虎。

数据优势只是短期优势,越来越短的短期。甚至在难以收集大量数据的专业领域里也是这样。Paige.AI拥有对斯隆-凯特琳纪念肿瘤中心组织切片库的独家权利,让它在癌症自动诊断方面先拔头筹。但过不了多久,从其他机构获得数据的同类产品必然会与其竞争。就像所有互联网巨头和独角兽公司一样,Paige.AI也必须不断创新才能保持优势。

在互联网时代,想取得长期优势必须不断创新,紧跟技术变革的趋势,引领消费者需求。