【黑马大赛总决赛冠军】旷视科技:世界第一的人脸识别技术Face++!
2012-11-26 10:59 黑马大赛

【年度黑马冠军】——旷视科技创始人唐文斌,他,高二时被清华预录取,目前还是一名清华研三的学生,黑马大赛上赢得克莱斯勒300C一辆!他主要从事人脸追踪技术研发,比如:可在顾客进商店门时,就知道这位客户是谁,还可以通过摇头晃脑控制游戏角色移动等

由创业家杂志主办的“第五届创业家年会2012克莱斯勒杯黑马大赛冬季赛暨年度总决赛”于2012年11月24日在北京国家会议中心举行,图为2012年黑马大赛总决赛3号参赛选手:旷视科技创始人唐 文斌

主持人:我们来邀请第三家企业上台,旷视科技的唐文斌,助阵嘉宾是天使投资人周哲,欢迎,请这位朋友开始你的3分钟吧。

唐文斌:谢谢主持人,我们提供的是面向开发者的服务,主要是做人脸识别的一些相关的工作。拿我刚才那张照片去我们的系统上识别一下,一定能够识别出来是亚洲人。前一段时间其实有一部电影很流行,叫做《谍中谍》,在里面有一个特别的场景,就是一个特工在马路上走的时候,看见路面有一个杀手过来,他就知道对面那个人是谁,这个事情其实并不科幻,现在这个事情我们让所有的开发者都可以做,我们提供一套基于云计算的服务,大家可以使用我们的服务几乎零成本的实现这些人脸相关的功能。

我们具体做四个方面,主要包括从检测,也就是找到你的脸在哪里,然后到识别,认出你是谁,你到底是不是某一个人,这是验证,或者是叫搜索。你长得像谁,然后我们还会提供一些分析的功能,主要是包括你是男的女的,大概是多大的年纪,你现在脸上的情绪怎么样,这些信息其实还是可以被用来做在一些精准定位的方面的。我们在2D人脸上其实会有一些问题,大家化了妆之后这个识别就会很困难,因为你自己也不认识你自己了,所以我们还提供一套3D的服务,就是我们会通过深度探测,或者是通过手机给自己这么拍一圈的方式去生成你的3D的模型,这个基本上在你整容之前,去韩国之前基本上还都能认识出来你是你自己。

我们有这些服务可以做什么呢?我们首先可以做体感游戏,就是我们可以在移动设备上,我们可以用我们的人脸去做操控,我们已经有两款游戏已经发行了。你也可以去用我们的技术,可以在商店进门的时候,就可以知道这位客户是谁,你上次来过,最喜欢喝的咖啡我已经给你倒好了。我在电视机前看广告的时候,我发现你是一位男士,就请不要跟我谈卫生巾广告了,所以还是有很多的应用场景了。

我们认为语音其实帮助设备解决了听的能力,视觉信息其实是帮助设备去解决怎么样去理解人能看懂这个信息的能力。而在所有的视觉信息里面,人脸信息是信息量最大的,也是对有用的。所以我们的产品叫Face++,大家可以到我们的网站上去看一看。这个东西这么有意思,为什么是由我们来做呢?因为我们的团队构成非常强,我介绍一下我自己,我是唐文斌,我是信息学奥林匹克的总教练,我们一共有15位成员,我们15位成员中有10位是技术的,并且这10位以前都是搞信息学院或者是搞大学生程序设计竞赛的。我们也有专门负责科研的同学,科研的同学在国外,在微软都做过很多科研的工作。我们的产品性能,我们曾经是世界第二,但是很尴尬的,我们现在成为了世界第一,因为最好的那家刚刚被Facebook收购。大家请关注我们,谢谢。

主持人:非常感谢,有请我们的助阵嘉宾,1分钟的时间。

周哲:其实我希望他做一些演示的,但是没有给这个时间。我其实30秒就可以说完了,这里面有两个重点,我刚才跟他聊了大概有一个小时,这个团队对整个人脸识别这个东西很熟悉,其实人脸识别有几十年了,为什么现在是一个时候呢?从硬件上来说,从iPhone4以后,这个事情完全不需要线上了,在手机上离线也可以做得到,这是一个时间点到了。这个团队我们所有评委都觉得是我们的第一名,因为实在是很好,很专注的在做这个事情。

周鸿祎:看了这个项目,收回刚才的吐槽,我认为还是有好项目的。我问两个问题,微软的做体感和识别对摄像头是有要求的,你这个技术对摄像头有没有什么样的要求?还是任何的PC,手机上的前置摄像头都可以支持?再就是性能问题,如果一台服务器我们以QPS来讲,你能支持多少每秒钟并发的对人脸识别的请求?

唐文斌:谢谢周总,这两个问题都特别好。我们现在在发展的过程中,我们所有的摄像头其实都在一个发展中,我们现在做的东西其实有两套,第一套是基于我们现在现有的这种普通的摄像头。我们刚才提到的检测、识别、分析都是针对这个普通摄像头开做的。微软的设备其实提供了一种深度探测,我认为在一两年之内在各种设备上都会被普及,我们在这方面也做了一些迁延性的研究。QPS其实取决于一张图片有多大,通常来讲,一台最小的服务器,从烂的CPU,最烂的内存差不多就够了,我们一台服务器至少每能够支持5到10个请求。

邓锋:你是我的学弟,我也是做图像处理的,我给你挑点刺,我25年一直搞图像识别,坦率来讲,技术的进步,跟整个人工智能一样,并不是那么快,相对来说因为难度太高了,不同的市场,不同的情况下需要不同的人脸识别的技术。我有两个问题,你的技术上到底有没有革命性的进展?除了云你刚才提的做服务以外,你有没有算法上或者什么革命性的进展?再就是你为什么不先找一个很好的应用?因为你提供做一个云平台,好像每个都能用,但是人脸识别需要定位不同的应用,其实识别技术可能很不一样。你为什么不先找一个应用,先从那个应用把你们的技术在那个应用上做得更实用化?

唐文斌:谢谢,第一个问题就是我们的技术怎么样。我们的技术有很大的特点,我们用大规模的数据做训练,这也是我们做服务的原因,我们会不断的积累数据,我们会用这些数据不断的优化我们的算法。在人脸识别上现在有一个公开的数据是LSW,这是做识别,给一堆人脸,看是不是同一个人。我们在这个上面,我们的评测目前是世界第一的。第二个问题就是我们为什么没有去找一个应用?这是一个很好的问题。我们其实先做了应用再做平台,我们先做了两款游戏,一款游戏在没有花一分钱的情况下到了AppStore的前几名,还有我们在苹果首页推荐了。我们现在的想法是应用是带平台,用平台再去把应用做好。这是一个相辅相成的过程。

邓锋:我觉得不错,我听起来你是用了云计算这种大数据的一些东西,这是跟以前很不一样的,我觉得这个还是很有意思的。

唐文斌:谢谢。

陈宏:我同意邓锋讲的,实际上很多公司做脸的识别,都不是特别成功,可以讲到现在来讲,你怎么有信心在中国这样一个企业,需要长期的耐心的投资,达到一个可以使用的标准?

唐文斌:谢谢陈老师,我觉得这个问题也特别好。我今天在接受采访的时候,他们问了这样一个问题,叫做创新与成就的关系,我觉得这个问题其实很有意思,如果把成就定义为去做好一件事情,其实我们可以做很多事情,也可以赚很多的钱。但是我觉得我们中国人一定要做一些创新,去做一些不一样的东西,做一些让这个社会有所前进的东西,这是我们能够产生自己的价值。以前为什么很多图像处理或者是人脸识别只能处理在特定的环境下,是因为数据少,一般的话会要求恒定光照,恒定场景,背景不动,就是对摄像机的要求也很高。随着互联网的发展,其实我们现在的图片越来越多,训练数据也越来越多,在这个过程当中其实我们可以做得更好。周总其实在做搜索引擎,我觉得搜索引擎其实不是一个算法的问题,是有很多的,我可能可以写出一个搜索引擎,但是我要去做各种各样的情况下,我能够把这个搜索做得更好,同样人脸也是这样的,我们在通常的情况下做得很好,但是我们可能有些情况,比如说脸侧光,这是做得不好的,这个我们是要不断的去通过工程化的方法把这个东西做到最好。