Twindex看穿你的政治倾向!准确率高达九成!
i黑马 i黑马

Twindex看穿你的政治倾向!准确率高达九成!

Twitter日前推出新服务,名为“Twitter政治指数”(Twindex),将庞大资料汇入精密运算式后,可即时观察选民反应,并分析总统候选人每日声势起伏。

Twitter此次合作对象包括网络社会化媒体分析公司Topsy,以及两家民调公司(立场左倾的Mellman Group 与较保守的NorthStar Opinion Research),希望利用Twitter的庞大资料,比盖洛普等传统民调公司更快统整出舆论走向,随着选举日期将至,各大政治新闻与评论都将引用Twindex调查数字。

欢迎光临政治海量资料时代。

2008年,Twitter共同创办人威廉斯(Ev Williams)走进公司内的小会议室,发现自家服务能即时追踪用户对当时总统大选的看法。Twitter曾委讬维恩(Jeff Veen)创办的Small Batch公司,希望建立网页,呈现人们讨论美国大选的情形,后来的成品为election.twitter.com,可追踪热门词语及有关各候选人的信息量。

几个星期后,这个页面正式上线,供众人一窥在Twitter上的讨论风潮,威廉斯对于成果相当乐观。威廉斯指出,这是网站其中一种可能发展,他指称那是Twitter的“沙拉”时期,意指那时人们最常发表的信息为午餐内容,不过他认为,“未来个人信息将愈来愈少,将更紧贴社会趋势及事件”。

2008年投票当天,Twitter网站流量也再创新高,用户共发表约180万信息,当晚公司内部气氛相当兴奋,除了许多人支持欧巴马(Barack Obama)之外,更高兴伺服器并未瘫痪,结果出炉后,经营团队欢呼的原因并非何人胜选,而是信息总数。

今日上述数字均已不足为奇,180万则信息只需六分钟即可达成,虽然早期选举页面看来很有趣,却不太适合分析,因为样本数还太少,不过时隔四年,一切都已改观。

Twitter如今拥有的资料量庞大,号称每月用户约1.4亿(外界估算约1.7亿),每日发送4亿则信息,且众多内容皆与政治相关,在Topsy、Mellman、NorthStar三间公司帮助之下,Twitter已找到方法从对话中撷取选民意见、加权衡量,归纳为每日数据,结果与盖洛普民意支持率颇为相近。

系统运作方式如下:

Topsy运用世界上每一则Twitter信息,建立一条中性基准线,分别统计关于两位美国总统候选人的信息、进行意向分析,再对比结果和基准线,每次统计三天份的信息,新信息权重高于旧信息,再依据个别候选人相关信息量占所有信息的比例,计算出候选人得分,完全中性的分数为50,高于50为淨正值,低于50为淨负值。例如若欧巴马得到38分,代表关于他的信息正面程度超过Twitter上38%的信息。

这项专案源于Twitter某天注意到,网站上关于两位候选人的对话内容,可准确预先反映在传统民调内的选民意向,例如福斯新闻台转播辩论时,询问观众投票评论候选人表现为“正面回应”或“闪避问题”,当时Twitter发现关于金瑞契(Newt Gingrich)的正面信息增加,几天后,金瑞契的民调数字确实提高,但Twitter早在辩论期间,就能即时看到这项趋势。

在密西根州与亚历桑纳州初选前,Twitter注意到追踪候选人罗姆尼(Mitt Romney)信息的人数大增,但对手桑托姆(Rick Santorum)却成长缓慢,而初选结果出炉后,也证实Twitter内部所见可预示选民思维变化。

因此该公司开始与上述三个单位合作,一同挖掘即时网络聊天内容里的政治资料,打算改善衡量选民即时态度的途径,Topsy收集世界上每一则Twitter信息,再制作三日均线,并编写一套演算式,判断每则信息内容属于正面或负面。双方也携手打造关键字引擎,并经过观察员反覆检查与改进,演算式判断选民立场的正确率高达九成。

这还只是改善流程的第一步,当电脑资料与观察员的结果出现差异时,就会修正演算公式,在历经反覆修改的过程,最终制作出Twindex,可即时产生结果,Twitter后来将数据与美国总统欧巴马的盖洛普民调支持率两相比较,结果颇为显着。

Twitter政府新闻与社会创新部门主管夏普(Adam Sharp)表示,“对比结果一出炉,就可见我们努力的方向无误,两者之间确有不少相似之处”。持续改善分析方法后,Twindex的调查结果与盖洛普民调资料相似度愈来愈高,但最值得注意的当然是趋势歧异之处。

夏普指出,“若两条曲线渐行渐远,则显示人们回答民调的内容与日常对话有别,这也是Twindex能帮助记者之处,代表我们还无法瞭解舆论全貌,必须提出更好的问题。”

对于出现差异,Twitter认为部分原因在于对话和回答特定问题有别,例如恐怖组织盖达首脑宾拉登(Osama bin Laden)死亡后数星期内,Twitter与盖洛普调查结果出现落差,选民在接受民调支持率访问时,或许会说出很正面的感想,但在Twitter网站上彼此聊天时,依然着重于日常经济疑虑。

未来Twindex也可能应用在其他议题,包括分析民众对各大品牌的观感,其他单位也可能发掘出其他用途。夏普表示,“我们与Topsy合作的其中一个原因是,希望建立Twitter的海量资料库,除了证明这些资料规模够大,并且使完全公开的资料产生价值。”

Via i黑马 By Wired

赞(...)
文章评论
匿名用户
发布