新影数讯:深度挖掘电影圈数据
2012-11-27 15:51 新影数讯

新影数讯正在利用社交网络和数据挖掘预测票房,据称准确率可达85%。它甚至可以准确地算出来:冯小刚的赚钱能力是张艺谋的1.5倍,“某知名女星的人气已经在走下坡路”等。

文/本刊记者 邓超(刊登在《创业家》第十一期)

如果预测电影票房也能纳入博彩业的话,刘晗(Water Liu)也许已经发财。他的新影数讯(iFilm+)正在利用社交网络和数据挖掘预测票房,据称准确率可达85%。

如何做到85%的准确率?刘晗是学物理出身,他首先确定出影响票房的几个变量,如演员、档期、上映时间、首映地,接着就要推算出公式中的定量,他的做法是从1990年以来上映的电影中抽样出四五百部,从统计年鉴中查到数据,然后让计算机逆向推导出定量,从而确定公式。预测时再把社交网络中反映出的变量填入公式,进行测算。

虽然业务和电影相关,但刘晗原本是个电影的门外汉。1999年,刘晗去英国读大学,毕业后在当地从事过酒店预订工作,当时便参与过对用户行为的分析。2006年刘晗回国,在IBM工作过一段时间后进入新浪,直到2010年离开。在新浪期间,他从事底层技术架构方面的工作,“从微博平台获取数据时,别人不知道怎么合理存储数据,我就知道它背后的规律。”离开新浪后,刘晗在中国移动的卓望公司写过微博开放平台的接口,还做过微博营销。但半年后,他认为微博营销已渐渐沦为4A范畴,想用技术做些新东西,于是便有了后来的新影数讯。

刘晗并不认为自己做着的事多么新鲜,因为挖掘用户行为一直伴随着商业活动,其中有些原理是相通的。今年暑期档,中国诞生了首部票房过7亿元的华语电影《画皮2》。新影数讯在上映前三个月便参与到造势活动中,主要负责以官微为核心的微博推广,同时通过对SNS数据的动态监控不断对宣传策略给出建议。

新影数讯的另一个业务更前卫——为挑选演员甚至导演给出“数字上的建议”。他们根据历史参数和社交网络上的数据分析来给出判断。“很多导演挑选演员是根据经验,而你只要告诉我要找什么类型的角色,系统就会根据演员的外形和之前对类似角色的演绎效果给出匹配”。此外,数据挖掘还能得出许多有趣的结论,比如“冯小刚的赚钱能力是张艺谋的1.5倍”、“某知名女星的人气已经在走下坡路”等。刘晗相信用数字说话,他的团队里也没有电影圈的人,但一味用定量的办法来阐述问题不会出现偏差吗?

今年3月成立以来,刘晗已接过5部影片的单。他预计新影数讯今年会有200万元的营收,他现在只采取简单的收费模式,将来会考虑分成。2010年国内电影票房超过百亿,同比增长63.9%;2011年则超过130亿元。刘晗认为自己的营收也会水涨船高。在2C方面,他想到的还是做推荐,也没有深入考虑对普通用户收费的事,“起码要等到知名度大过豆瓣、时光网再说”。