在万亿级的数据油田开采,大数据行业的"中石油"数据堂
2017-10-24 10:48 数据堂 齐红威 黑马营 大数据

新三板第一家挂牌的大数据公司数据堂在成立之初就决定做难做的“苦活”,在它采集了5年的线下数据之后,就形成了一个数据壁垒。而2015年以来政府对大数据产业不断地支持和政府数据的开放,也助推了数据堂纯线下数据和行业数据以外的政府数据的布局。

齐红威

数据堂创始人、黑马营10期学员

数据堂创始人齐红威在成为商人之前的身份是NEC中国研究院研发部部长。在他近十年的数据应用和分析中,一直需要解决的问题是四处去找数据。所以当齐红威2011年带着他在NEC的核心班底决定创业的时候,就选择要去做一个数据源的平台。

为什么不继续做他们一直从事的数据应用解决方案,齐红威的考量是,数据应用直到今日也没有一个统一的行业标准,在2011年时更是只能根据客户的需求不断变化。“做数据应用很难做到标准化……最终(做)数据应用肯定是一堆的企业。”齐红威说。

“数据应用很难标准化,并不代表数据不好标准化。”齐红威把数据源比作石油,石油在成为各种形式的化工品之前是有统一标准存在的 。而在油田资源领域,最大的只有中石油、中石化几家。齐红威把数据源领域当做一片还无人开采的油田,在他的设想中,数据堂要成为这片油田里的中石化。

至少到目前为止,数据堂在这片油田里是跑在别人前面的。2014年12月10日,数据堂正式在新三板上市,成为中国大数据交易及服务行业第一家挂牌新三板的企业。2015年11月6日,数据堂完成2.4亿的B轮融资,其估值超过20亿元人民币。

与石化行业的生产模式类似,数据堂的业务模块分为三部分:数据源采集加工(拥有超过46万人的众客堂数据采集平台)、数据在线交易(国内首家数据电商平台DataMall)和数据云服务(为移动应用提供数据API接口服务的数+)。

把难做的事情做成了价值很高

对于数据本身,齐红威自己把繁杂的数据分为四类。第一类是在现实中没有现成数据而需要去采集的纯线下数据;第二类是企业在主营业务中产生的大量行业数据;第三类是在网络中产生的大量数据称为互联网数据;第四类是政府数据。

数据堂主要关注的是纯线下数据和行业数据。齐红威认为,虽然互联网数据的规模很大,但是里面无用的信息也很大,同时内容又很单一。在对事物进行分析的时候,单靠线上数据很难完成。而线下数据收集起来很难,需要花费大量的人工、时间和资本才能从无到有完成一定量的积累,但齐红威认为这正是线下数据的价值。“越好做的事情,它的价值就不高。越难的事情你做成了,价值很高。”

数据堂在2011年成立之初就建立了众客堂的模式,以任务的形式把需要采集的数据分发给兼职的大学生等等。从无到有,如今众客堂已拥有超过46万众包客,其中更多的也不再是学生而是以专业采集数据的团队为主向数据堂提供数据源。

采集完的数据经过数据堂的加工后变为一类标准的数据放在DataMall上售卖。而标准也是在某一类数据或指标上的局部标准,齐红威表示目前整个数据应用层面的行业标准还未建立,这是制约数据行业发展的一个主要因素。

政府的数据在开放

另一个制约数据行业发展的是政府层面对数据行业的政策。政府拥有大量优质的数据,但其开放程度很低。“2011-2013年,甚至2014的上半年,政府开房数据的速度其实一直是非常慢的……我们去找政府相关部门谈数据的时候,大家根本没有任何意愿或者方式去开放这个数据。”齐红威说。

但从2014年下半年开始,政府对数据的开放程度前所未有。2015年初,国务院下发《关于促进云计算创新发展培育信息产业新业态的意见》,提出要加强大数据开发和利用,充分发挥云计算、大数据在智慧城市建设中的服务支撑作用。

7月31日,工信部信息化和软件服务业司组织召开了大数据产业“十三五”发展规划编制第一次工作会议。

9月,国务院印发《促进大数据发展行动纲要》,其中重点提出要大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。

这对数据堂自然是一件政策利好的事情。虽然齐红威认为政府数据开放的速度不会那么快,具体实施的细节还有待落地,但数据堂已经和一些政府部门合作也获得了一些数据。

具有典型性的则是数据堂在11月即将要联合青岛即墨市政府一同发布的即墨市政府大数据公共服务平台。在这个平台中,即墨市政府负责政府大数据开放的保障,数据堂负责平台的数据运营服务。

2014年,数据堂的营业收入达到1837万。齐红威预计,2015年数据堂的收入将超过6000万。这对于未来万亿级大数据行业的规模来说还只是开始,但齐红威信心满满,认为数据堂早行业3年的先发优势将让数据堂在此后的竞争中占据主动