像提炼石油一样提炼数据,数据堂估值超20亿
田牧 田牧

像提炼石油一样提炼数据,数据堂估值超20亿

新三板第一家挂牌的大数据公司数据堂,在成立之初就决定做难做的“苦活”,在它采集了5年的线下数据之后,形成了一个数据壁垒。

i黑马 田牧 11月27日报道

大数据企业首家挂牌新三板

数据堂创始人齐红威在出来创业之前,他的身份是日本电气公司(NEC)中国研究院研发部部长。在他近十年的数据应用和分析中,一直需要解决的问题是四处去找数据。所以当齐红威2011年带着他在NEC的核心班底决定创业的时候,就选择要去做一个数据源的平台。

为什么不继续做他们一直从事的数据应用解决方案?齐红威的考量是,数据应用直到今日也没有一个统一的行业标准,在2011年时更是只能根据客户的需求不断变化。“做数据应用很难做到标准化……最终(做)数据应用肯定是一堆的企业。”齐红威说。

“数据应用很难标准化,并不代表数据不好标准化。”齐红威把数据源比作石油,石油在成为各种形式的化工品之前是有统一标准存在的 。而在油田资源领域,最大的只有中石油、中石化几家。齐红威把数据源领域当做一片还无人开采的油田,在他的设想中,数据堂要成为这片油田里的中石化。

至少到目前为止,数据堂在这片油田跑在别人前面。2014年12月10日,数据堂正式在新三板上市,成为中国大数据交易及服务行业第一家挂牌新三板的企业。2015年11月6日,数据堂完成2.4亿的B轮融资,其估值超过20亿元人民币。

与石化行业的生产模式类似,数据堂的业务模块分为三部分:数据源采集加工(拥有超过46万人的众客堂数据采集平台)、数据在线交易(国内首家数据电商平台DataMall)和数据云服务(为移动应用提供数据API接口服务的数+)。

众包模式做数据采集

对于数据本身,齐红威自己把繁杂的数据分为四类。第一类是在现实中没有现成数据,而需要去采集的纯线下数据;第二类是企业在主营业务中,产生的大量行业数据;第三类是在网络中产生的大量数据,称为互联网数据;第四类是政府数据。

数据堂主要关注的是纯线下数据和行业数据。齐红威认为,虽然互联网数据的规模很大,但是里面无用的信息也很大,同时内容又很单一。在对事物进行分析的时候,单靠线上数据很难完成。而线下数据收集起来很难,需要花费大量的人工、时间和资本才能从无到有,完成一定量的积累,但齐红威认为这正是线下数据的价值。“越好做的事情,它的价值就不高。越难的事情你做成了,价值很高。”

数据堂在2011年成立之初就建立了众客堂的众包模式,以任务的形式把需要采集的数据分发给兼职的大学生等等。从无到有,如今众客堂已拥有超过46万众包客,其中更多的也不再是学生,而是以专业采集数据的团队为主,向数据堂提供数据源。

采集完的数据经过数据堂的加工后,变为一类标准的数据放在DataMall上售卖。而标准也是在某一类数据或指标上的局部标准,齐红威表示,目前整个数据应用层面的行业标准还未建立,这是制约数据行业发展的一个主要因素。

政府的数据在开放

另一个制约数据行业发展的是政府层面对数据行业的政策。政府拥有大量优质的数据,但其开放程度很低。“2011-2013年,甚至2014的上半年,政府开房数据的速度其实一直是非常慢的……我们去找政府相关部门谈数据的时候,大家根本没有任何意愿或者方式去开放这个数据。”齐红威说。

但从2014年下半年开始,政府对数据的开放程度前所未有。2015年初,国务院下发《关于促进云计算创新发展培育信息产业新业态的意见》,提出要加强大数据开发和利用,充分发挥云计算、大数据在智慧城市建设中的服务支撑作用。

7月31日,工信部信息化和软件服务业司组织召开了大数据产业“十三五”发展规划编制第一次工作会议。

9月,国务院印发《促进大数据发展行动纲要》,其中重点提出要大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。

这对数据堂自然是一件政策利好的事情。虽然齐红威认为政府数据开放的速度不会那么快,具体实施的细节还有待落地,但数据堂已经和一些政府部门合作也获得了一些数据。

具有典型性的则是数据堂在11月,即将要联合青岛即墨市政府,一同发布即墨市政府大数据公共服务平台。在这个平台中,即墨市政府负责政府大数据开放的保障,数据堂负责平台的数据运营服务。

2014年,数据堂的营业收入达到1837万。齐红威预计,2015年数据堂的收入将超过8000万。这对于未来万亿级大数据行业的规模来说还只是开始,但齐红威信心满满,认为数据堂早行业3年的先发优势将让数据堂在此后的竞争中占据主动

数据堂 估值
赞(...)
文章评论
匿名用户
发布