科大讯飞:中国版Face.com
2012-12-26 17:01 科大讯飞

这支有清华背景的年轻团队有望成为人脸识别领域的“科大讯飞”。

文/本刊记者 李传涛(刊登在《创业家》第十二期)

评委点评:

天使投资人周哲

技术产品的潜在市场很大;团队人员很聪明,有能力,但技术需进一步打磨。

如果你看过《碟中谍4》,肯定会记得这样一个场景:茫茫人海中,特工利用隐形眼镜的人脸识别功能迅速锁定目标。事实上,人脸识别技术已发展40余年,并开始在互联网服务中得到应用,比如网易邮箱、百度相册今年都融合了人脸识别功能。

而让移动应用开发者能够轻松实现各类人脸识别应用,是北京旷视科技有限公司(下称旷视科技)正在做的事。在11月25日的2012克莱斯勒杯黑马大赛总决赛上,旷视科技成为名副其实的黑马,最后时刻反超群雄,成为年度冠军。

年轻的平台公司

旷视科技和它的创始人一样年轻。

1987年出生的唐文斌是旷视科技联合创始人兼CEO,目前仍就读于清华大学计算机系,临近研究生毕业。最晚在2008年,唐文斌就意识到人脸识别具有广阔的应用前景,并开始研究。

2011年,当谷歌创始人布林佩戴谷歌眼镜出现在谷歌I/O大会上时,唐文斌意识到:机会来了。“所有视觉信息里,人脸信息是最有信息量的,也是用途最广泛的,我们就选择这个点。”当年10月,唐文斌和两位清华同学共同创立了旷视科技,并将前期几位创始人围绕人脸识别的研发成果工程化,旷视科技的主要产品也以“Face++”命名。

人脸识别应用场景广泛,大到公安、机场、安防等重要行业,小到智能门禁、考勤等民用市场。旷视科技成立初期,将目标瞄准移动游戏,先后在iOS平台上推出了Crows Coming和《街头速滑》两款游戏,主要应用人脸识别和人脸追踪等技术评估当前玩家的运动姿势,从而操控游戏中的角色。据媒体报道,截至8月底,Crows Coming的总下载量已超过40万次。

如果一直这样,今天的旷视科技充其量是一家还不错的游戏公司,但另一件事改变了旷视科技的命运。6月,社交网络巨头Facebook收购了以色列人脸识别技术公司Face.com,并很快决定关闭后者的API(应用开发接口)。在此之前,大量第三方软件通过Face.com接口使用人像识别技术。

唐文斌注意到,很多开发者反映人脸识别技术接口关闭带来的不便。“其实我们技术和他们差不多,我们就决定开放出来。”检出率和识别率是判断人脸识别技术水平的主要标准,在公开的技术评测中,旷视科技的检出率不如Face.com,但在识别率上略胜一筹,他们有一种3D人脸技术,主要解决化妆后识别不出来的问题。

其实,至少在4月,唐文斌和伙伴们已经开始对做一家游戏公司产生了动摇。“团队的基因不适合做游戏,因为我们本身不是特别喜欢游戏,团队最合适的是把技术做好。”

8月底9月初,经过深思熟虑,旷视科技决定正式转型为人脸识别技术平台,除了在云端提供计算服务外,也会提供线下离线版本。在公司官方网站上,记者看到,9月13日,Face++ 0.9版本已经上线,面向开发者提供人脸检测、人脸识别、面部分析等视觉技术服务。Face++ 1.0版本则于10月25日上线。

当前,各大互联网公司都在布局人脸识别技术,开放本身就是一种差异化战略。“我们与大公司竞争靠两点,第一是做得比他们好,因为我们跑得比他们快;第二是大公司不可能把技术开放,而我们开放。”唐文斌说。

先用起来

在黑马大赛总决赛现场,为唐文斌“站台”的天使投资人周哲说,到现在还没想好这个项目怎么赚钱。

人脸识别的应用主要围绕身份和数据两个关键词。所谓身份,即通过人脸识别进行用户的身份识别。在数据方面,人脸识别还可以帮助进行特征分析,如人物的性别、表情等等,可以帮助推进销售。

转型为平台后,唐文斌设想的商业模式是:对于一般开发者实行免费策略,对于API调取量较大的企业收取一定的授权费用。“我们现在还没想过收钱,而是让大家先用起来。”对于明年能够挣多少钱,唐文斌自己心里也要打个问号。

在正式成为平台三周后,Face++已经吸引了约1000名开发者,累计API请求量25万次。对于未来重点,唐文斌已经有了思路:“我们会把服务包得更厚、更好用。我们提供的将不仅是技术层面的接口,而是产品层面的接口,比如人脸(识别)登陆,可能只需要写一行代码就全搞定了。”此外,游戏也不会被放弃,“我们想让应用带动平台,用平台再去把应用做好,这是一个相辅相成的过程。”唐文斌说。

目前,旷视科技的团队共有15个人,以研发人员为主。此前,通过一位师兄的介绍,旷视科技在成立时获得了联想之星的天使投资,而在投资人的介绍下,旷视科技新引入了一位曾在百度和惠普任职的新合伙人。旷视科技准备将团队扩大到20—30人,以完善人员架构。

决赛中,奇虎360创始人周鸿祎将手中的一票投给了旷视科技,但是对其有三点“吐槽”:“第一,团队过于技术化,对市场理解缺少;第二,不专注,你觉得自己无所不能,去做很多事;第三,一直主张做平台,这是一个致命的问题,你为中国的开发者服务,中国的开发者又是最穷的。”

唐文斌也坦承,“(人脸识别)应用很广泛,最核心的应用还没有想清楚。”他以移动互联网语音功能为类比,“很多年前,大家也不知道语音(技术)能做什么,这不是想出来的,而是需要我们去做。”不过,在移动互联网兴起前,做语音的科大讯飞过了不少年苦日子。旷视科技会成为第二个科大讯飞吗?