世界杯结束,法国队夺冠,为何AI预测被打脸?
2018-07-16 08:54 世界杯 AI

AI预测被打脸?我们天台见

此前,高盛、瑞银、多蒙德大学等都利用AI技术对2018俄罗斯世界杯进行预测。比赛结果却大相径庭:高盛认为巴西最终会捧起大力神杯,瑞银推断是德国。AI预测足球赛,还没那么准。

凌晨,随着法国和克罗地亚的决赛,法国队夺冠后,这届俄罗斯世界杯也宣告结束。

本届世界杯,我们见证了一场场精彩的比赛,看到每个队的球员为了国家荣誉勇敢拼搏,也看到了现场的观赛的球迷,充满激情地为自己的国家加油助威。

除了精彩的比赛,这届世界杯也引入了诸多科技——5G、VAR、智能设备、人工智能等,其中,AI赛事预测在世界杯的应用最为人们关注。

B2B圈了解到,咨询机构、金融机构、博彩公司、科技企业等都在赛前或者赛中,利用AI的各种算法模拟预测数千万场比赛,进行每场比分预测,预测大赛冠亚军。

有趣的是,人工智能的预测结果却差强人意。赛前,高盛集团利用数据挖掘、机器学习和计量经济学对比赛结果进行了百万次模拟,从而预测出每轮比赛中的胜利者。高盛最后得出结论:决赛中,巴西队会击败卫冕冠军德国队,最终捧起大力神杯。

这样的例子还有:德国多特蒙德大学研究者,通过设计的独立AI产品预测到,西班牙将赢得大力神杯;瑞银集团则在使用了“用以帮助客户挑选股票的计量经济学工具”后得到了“高度精准的模型”,认为德国队将再次捧起大力神杯。

可是,随着德国、西班牙、阿根廷、法国、葡萄牙等传统豪门球队接连被淘汰,无论是足球圈、科技圈还是金融圈,对AI预测这件事充满了嘲讽声:AI预测被打脸,我们要“天台见”。

那么,AI是否能够预测比赛赛事?原理是什么?AI预测失败的原因是什么?相信看过B2B圈这篇文章后,大家会有一定的答案。

 AI预测赛事,还在探索期 

AI预测是基于企业历史数据分析、利用深层次的数据模型和机器学习等算法,替代传统人为的经验式决策,预测分析出结果,从而可以快速帮助企业搭建从数据分析到商业决策的桥梁,进而使企业在复杂的数据环境中找到最佳解决方案。

目前,AI 预测已经应用在金融、零售、制造、医疗、文娱等领域。如零售业的库存管理、产品销量预测;制造业的工厂设备故障预测;金融业的信用卡逾期还款预测和借贷风险预测;医疗领域疾病的预测;文娱领域通过AI预测奥斯卡奖项、AI预测综艺选秀节目的冠军……

这些场景都在实践AI预测,体育赛事也不例外。早在AI预测世界杯足球赛事之前,已经有人把AI预测到橄榄球、网球、篮球等领域。其中,“超级碗”比赛(是美国职业橄榄球大联盟NFL的年度冠军赛)是AI预测赛事最为典型案例。

2017年2月,美国的Unanimous A.I.公司利用自主UNU平台成功预测了“超级碗”的准确比分。此外,Unanimous A.I.准确预测了肯塔基赛马会的一项比赛结果,这项结果的赔率为540比1。这也让该公司创始人路易斯·罗森博格(Louis Rosenberg)用20美元赚到了1.1万美元。

据悉,Unanimous A.I.创始人罗森博格将“蜂群思维”引入UNU中,让用户可以通过移动游标,使结果更接近想要的答案,从而协调预测。在其平台上,AI提供后端算法,这些算法监控到用户在平台上如何互动,他们的互动是否表现出信心、过度信心或不确定性,并试图引导游标移动至最能代表群体观点的位置。

简单来说,通过蜂群实验,可以将预测结果与实际情况进行对比,罗森博格及其团队希望获得具有统计意义的足够数据来完善平台,让预测更准确。同时,其他研究人员也在多项研究中测试蜂群智慧的理论,也取得了良好的结果。

例如,根据相关资料显示,在牛津大学的一项研究中,美国足球迷被要求预测英超联赛的比赛结果。在他们进行预测时,准确率约为55%。而作为“蜂群”的一部分,他们的准确率上升至72%。

据悉,关于今年的“超级碗”,UNU也做出了预测,结果是爱国者队将以4到6分的优势胜出,比赛总分将超过48.5分。此外,UNU还成功预测了马克龙当选法国总统,不过这是题外话了。

再回到今年世界杯的AI预测赛事结果,以高盛集团为例,他采用AI技术,综合每个球队的小组表现、球员的个人表现、往年世界杯战绩等信息,利用机器学习模型将这些数据与2005年以来的世界杯和欧洲杯比赛得分进行对比,然后,他们还对世界杯进行了100万次模拟,最终预测结果显示,巴西最终将在决赛中击败德国。

然而,结果我们都看到了,德国、巴西全部出局,无缘世界杯决赛。那么,为什么AI预测在体育赛事里,预测结果如此不稳定?

 缺乏有效数据 

通过以上对比,我们不禁要问,AI预测“超级碗”比赛已经很不错了,为什么却惨败在本届世界杯上?答案是:赛事不确定性太强,缺乏有效数据支撑!

我们知道,AI的发展离不开数据、算法、场景化落地这“三驾马车”,其中,数据是基础,是AI的原材料,同时,这些数据是指企业经过处理和加工后的高价值数据。如果数据量不够、质量不高,很难训练算法模型,更别说产品化、场景落地了。

其实,早些年AI沉寂了很长一段时间,很大程度是因为算力以及数据的匮乏。现在,随着存储变得非常便宜以及数据大规模的爆发,涌现出了非常多的应用,这一时期的代表性事件为阿尔法狗大战李世石,使得AI重回大众视野中。

业内人士认为,体育赛事会带来大量人工智能开发者喜欢的数据。具体的例子包括篮球前锋的投篮命中率、橄榄球选手的跑动距离,以及足球中场球员的助攻等。体育赛事中还有其他不太明显的数据,可以让我们获得更精细、更完整的视点。

然而,在数据的数量和质量方面,并非所有体育运动都是平等的。例如棒球,很容易拿出球员的各项统计数据。而网球协会则会收集高精度数据集,其中包括比赛中球的运行轨迹,从而让预测分析变得更简单。

具体到足球赛事上,会涉及选手的身体状态,精神品质,球队士气、教练的排兵布阵、球员的临场发挥,裁判的争议吹罚等因素,这些数据不但会影响赛场发挥,也无法收集有效数据,反哺模型算法。

其次,有些比赛压根就没有数据。国家队之间的历史交战记录非常稀疏,这些数据没有任何借鉴意义,这样无法提供足够多的信号支持预测的结果。

此外,业内人士认为,数据本身也具有一定的欺骗性,毕竟在统计时,一脚世界杯进球和对方的乌龙球都会成为比分牌上的数字“1”,但这个数字却无法完全真实反映场上的情况。

总的来说,在足球赛事上,缺乏大量有效的数据支撑,同时球赛的影响因素充满着不确定性,无法通过数据反哺模型训练,这样就很难做出正确的预测。