知微:数据化分析你的微博传播
2012-11-27 15:32 知微 数据挖掘

杜蕾斯官微最早看中了他,他最喜欢的事情是把微博传播看个真真切切。

文/本刊记者 邓超(刊登在《创业家》第十一期)

于霄的公司注册在北京,但团队却都在哈尔滨。他的宏博知微今年8月成立,不过自己已经在两地间跑了近一年。去年12月,于霄的第一个 “客户”找上门来,这便是杜蕾斯。

能招惹来“杜杜”不是因为于霄有多大名气,而是他的两个新浪微博账号“社会网络与数据挖掘”和“名人微观察”。前者去年9月注册,从11月起开始发布对微博热点事件的数据分析,最初的案例是“决战亮马桥”,从认证用户比例、地域分析、每小时转发量、核心人物等几个维度进行解析,同时与当时某家居品牌的有奖微博活动进行对比,直接指出后者存在93%的垃圾转发。

2011年年初,还在哈工大读博士的于霄开始研究社交网络的数据挖掘。他说做这个微博时想得比较简单,“汇聚一些行业信息、汇聚一些行业里的人,同时也发布我们的一些工作成果”。事实上,当年9月,他的团队就已经有几个全职人员加入。

不过,“决战亮马桥”的案例微博转发只有十几次,“社会网络与数据挖掘”最初的哑火一直持续到12月中旬名人微博热度统计的发布。第二天,一个新开设的账号发了这样一条微博:“昨天的几个数据统计贴总计被转发2000多次,考虑到接下来仍有大量名人数据发布,必须采用独立账户运行……”,这便是于霄团队的另一个微博账号“名人微观察”。其最近一期的热度榜被转发了15000多次,但其中有一大半来自榜单第一的吴奇隆认证微博的转发——“……#新白发魔女传#真心给力呀……孩子们转起来吧”。记者通过第三方工具检测,发现该条微博的转发人群中有93.8%的女性和6.7%的僵尸用户。

转发很热,也引起了一些企业的注意,不过杜蕾斯似乎并不是为了大号转发而来,因为即使到现在于霄粉丝最多的一个号也只有2.7万个粉丝,有没有别的大号不得而知。据杜蕾斯社交网络运营团队负责人金鹏远介绍,他们让于霄做的是一些技术服务。当时于霄的 “产品”还没有前端,只是后台根据客户的需求来跑程序、出报告。

模式粗糙效率低。今年3月,于霄叫停多数对外业务,“我们感受到很多业务完全可以整合成通用性的产品来做”。于是,于霄自己拿钱连续研发了几个产品,知微就是其中之一。知微今年8月上线,是一款网页端的微博传播分析工具,有普通版和高级版之分。普通版只支持2000以下转发的微博传播分析,试用用户每天只可用10次,可分析出水军比例、微博传播引爆点、传播情感倾向、传播参与用户部分指标、传播关键词等数据。

于霄表示,知微高级版和其他几个产品(以消息分析、账户分析、事件分析等分类)目前只展示给客户,对于其中具体有谁他三缄其口,说其业务只是微博产业链中的一环,客户动态性很强,但也包括“三大运营商、四大国有银行”,“还有一些大佬”。言谈中可以感觉到,于霄最初从事社交网络数据分析的重点在于对水军的挖掘,并建立了一个水军识别模型,“采用了机器学习算法,在大量案例库基础上生成”,“让很多喜欢作假的营销公司寝食难安”。当被问及是否担心因此被人忌恨时,于霄说自己初衷很简单,“我们不喜欢任何虚假的东西,我们是Data Scientist”。