这是川普获胜的大杀器?
2016-11-09 17:29 美国大选 大数据

总统竞选,已经从政治经验和民众倾向的复杂判断变成了精准微妙的数字游戏。

推荐人:黑马哥

推荐星级:☆☆☆☆

阅读时间:5分钟

推荐理由:今天川普可谓演绎了一次什么叫黑马。在此前一众人不看好,大量媒体唱衰的情况下,他以289:218击败希拉里。除了壕和所谓的民粹支持外,川普在科技化和数字化上有什么大杀器?本文由TalkingData(ID:talkingdata)授权i黑马发布,仅供君参考。

在当所有人都在讨论川普当上总统时,让我们也聊聊这次大选背后的故事。我们并不是要说那些花边新闻和惊人爆料,而是大选背后的大数据技术。2016年这场美国总统竞选被媒体称作“第一次数字化竞选”,希阿姨和川大大都组建了庞大的技术团队,将大量资金花在获取和使用投票者的信息上。

当总统竞选的宣传推广在社交网络上全方位展开时,其实是在诱导选民及吃瓜群众的社会认同;曾经以“为民众赋予权力”为基础的民主制度,在对个人数据不断收集加工后,在一定手段下可能就变成针对个人的行为操纵。人们以为是自己做出了选择;但其实只是坠入了精心设计好的罗网。

这和商业巨头们对消费者所做的事情很像,让潜在消费者心满意足地掏出钱包和投出选票,在本质上并无不同。这同样也说明,政治家入主白宫的争夺已经进入了“微竞争”时代——胜利取决于是否能比竞争对手更深入地挖掘潜在选民的个性化需求,并且适时满足这些需求。

这不是《1984》里“黑大哥在瞅着你”的简单翻版,而是现代信息化时代的真实写照。如今世界上到处都留存着人们的忽略的数字痕迹:每一次注册登录、每一次网络搜索、每一步行走、每一条社交网站上的状态更新,都会被系统如实的记录,被加工整理,最终做出针对你的个性化决策。

在这场沸沸扬扬的政治宫廷大戏的新闻中,我们不难看到许多频繁出现的关键词:大数据、社交网络、软件机器人、邮件、黑客,甚至包括是维基解密爆料。今天的候选人们已经意识到,以互联网为基础的信息技术可以在政治角逐中起到决定性的作用。人们将自己的信息放在网上,让各种网站记录自己的个人和财产信息,在社交网络上公开发表观点。这些公开的信息可以用来描绘出特定用户的面貌,其准确程度远远超过人口普查的结果。在这些数据中,蕴藏着商业和政治的新机会。

这和过去相对传统的美国大选有着很大区别。2008年奥巴马获选的重要原因之一,正是借助了互联网的传播优势。在他竞选成功后,《The New York Times》曾指出:“没有互联网,就没有奥巴马。”奥巴马和选民们在社交网站上的互动,帮助他获得了历史上最多的选民票,以及数额最高的小额募捐资金。按照《Wired》杂志的观点,奥巴马在竞选连任时,“对当初帮他入主白宫的69,456,897名美国人了如指掌。”

 

数据的力量

在进入新世纪之前,美国总统竞选采用的还是延续多年的方式:电视广告、电子邮件、上门拜访、社区活动和巡回演讲。在2000年的选战中,候选人开始用互联网来募集竞选资金和动员志愿者;2004年,刚刚发展起来的数据挖掘技术就成了竞选中的核武器,用来分析特定群体的需要,然后为他们定制具有针对性的传播方案和传播渠道。

在2016年的美国大选中,新技术不断被开发并持之使用,过去的传统技术被应用到极致。美国总统竞选从来都是一项注重公众参与的活动,了解公众的需求,了解公众的喜好和愿望再加以满足,是入主白宫的根本;现在的候选人们早已意识到,大数据技术是走进白宫必要的门票。

民意调查结果,一直是总统大选时最倚重的数据来源。在长达半年的总统竞选活动中,会有许多组织或机构通过不同方式进行大量调查,并将结果汇总整理加工成民意调查数据。在更大的数据规模上,总统候选人们也采用了同样的策略,所依赖的数据来源也不仅仅是民意调查结果,还涵盖了诸多的如facebook这类的社交网站和公开及私有的数据库。及时准确的收集这些数据,并且帮助制定策略以获得更多的选民支持。将美国超过2亿的选民资料,与大型网站与社交网络上的个人账号相互匹配起来,将网络行为对应到具体的个体,再和已经构成的、庞大的用户个人数据相结合,最终完全由准确数据来驱动竞选策略。而以上这些就使得大数据分析技术成了两党候选人的重要武器。

传统上的美国总统竞选,候选人代表的是利益集团的声音,但是在大数据时代,每一个选民都变得重要起来。由数据驱动的竞选策略,将会帮候选人筛选出吸引特定选民的最佳行为。这意味着电视广告的时段和内容、网站广告的选择和展示时间,甚至是应该用电子邮件还是电话来争取这位选民的选票。

两方都在争取那些摇摆的投票者,这些人可能因为某个细微的举动、某句话就转投另一个阵营。摇摆投票者们的意识形态、价值观和哲学各有不同,乐于接受的信息方式和接受信息的渠道不同,对候选人的关注点也不一样。

数据决定了谁将会是下一任美国总统,总统竞选也从政治经验和民众倾向的复杂判断变成了精准微妙的数字游戏。候选人的技术顾问们通过各种活动、数据库和社交网站构建选民数据库,再精益求精地改善算法,以求设计出最可能赢得选民的政策、说辞,甚至是细微的动作和外套的颜色。这是高度定制化的竞选策略,背后隐藏的是对选民详细资料的透彻了解。这些技术可以达到相当精细的程度:今年8月,共和党在一次宣传活动中,通过10万个网页向社交网站Facebook的用户展示了广告,而其中每一个网页都瞄准了一位不同类型的选民。社交网站上的用户在政治倾向上,会受到自己网络好友的影响。对于争取那些还没有决定要投票给谁的选民来说,这一点尤为重要。识别用户之间的社交关系,带动那些摇摆者投向某个方向,也是重要的竞选策略。

 

投网民所好

在全民上网时代,我们已经做到与选民面对面的沟通,想要了解他们的需求和观点也不再是遥不可及的任务。社交媒体正在成为新的主要新闻源,仅仅从2013年到2015年,通过Facebook和Twitter之类社交媒体来获得新闻的用户比例就增长了30%,在年轻人中,比例还会更高。甚至是今年的候选人辩论也延伸到了社交媒体上,成了全天候的多方对话,而不再只是电视上三小时的激烈辩论直播。

在2016年10月18日晚上最后的总统候选人辩论时,大众不仅关注辩论本身,也同时在关注以推特为代表的社交媒体。数据分析公司实时收集用户的言论,再把结论发给大众。辩论刚刚结束,结果就已经出现:和特朗普有关的言论中,带有负面情绪的内容占了62%;和克林顿有关的言论中,带有正面情绪的占了54%。

社交媒体的互动特性使收集观点和预测投票变成了常规的实时活动,两个阵营都在收集各大社交网站的数据,分析每一次发布的转发和评论,再仔细考虑下一次发布的措辞。在了解选民信息和倾向的基础上,竞选团队和选民甚至可以深入地一对一沟通,从而加深彼此关系,并获得更多选票。

 

偏离选举的初衷

即使能够收集选民的数据,也不意味着会得出准确的结果。在科学实验中,为了得出客观的结果,观察者不应该介入系统当中,但选举过程并非科学实验,而对数据的挖掘和展示本身也会影响到整个系统。每次预测的变化都会引发大量媒体报道和社交网络话题,这些话题会影响选民的投票意愿,继而又影响预测算法的结果。这样的效应可能会导致整个系统都偏离了方向。

最重要的是,以数据驱动的竞选策略,可能会偏离选举制度的初衷。通过对选民分类来区别对待,让政治变得更像是商业化的营销活动。Facebook在两年前的一项实验证实,可以通过控制用户接收到的信息流来操纵用户的情绪。当总统竞选在社交网络上全方位展开时,其实是在诱导选民社交圈的社会认同;曾经以“为民众赋予权力”为基础的民主制度,可能变成针对个人的行为操纵。人们以为是自己做出了选择,但其实只是坠入了精心设计好的罗网。

今天人们对网络生活的态度、对信息工具的依赖,以及对网络渠道的重视程度,都和四年前不能同日而语。信息技术正在影响我们思考和做出决策的方式,而“影响他人”也已经有了全然不同的含义。

这让2016年的总统大选变成了全新的开始。政客们和他们的竞选团队固然会更了解选民们的个人信息,但也会更清楚民众的愿望。数据虽然提供了更多诱导大众的工具,但也让政客们更多受制于民众真正的需要。

候选人们已经意识到,他们所身处的世界,信息正在变得更公开透明。技术搭起了桥梁,让候选人和选民不再是彼此陌生的概念,政客们将会更认真地考虑民众的想法,而选民们将会更乐于发出自己的声音。这应该是双赢吧。