Face++:布局刷脸生态
2015-07-02 14:12 Face++ 刷脸生态

基于人脸识别技术的“机器之眼”,将成为Face++ 生态体系的核心。

作为一家专注于图像识别和深度学习的技术公司,成立于2012年的Face++,短短三年时间,就已发展成为全球使用量最大的人脸识别引擎。不仅如此,Face++ 基于优势技术,已将阿里、360、微博、陌陌、美图秀秀、Camera360、魔漫相机、世纪佳缘、联想等一批大型图片、社交、设备类企业会聚到了自己的生态进化链条中,形成了一个虽然目前还较为松散,但前景无限的生态联盟。

在Face++ 创始人、CEO 印奇看来,人工智能是下一代科技创新的主战场,而Face++ 要做的“机器之眼”,就处在这个大生态系统的核心环节上,而只有让机器看懂世界,才有可能真正实现人工智能。

“我们并不担心市场的大小,因为这个技术的应用领域很广。自创业之初,我们就知道,Face++ 的业务扩张之路不会是单一的一条线,肯定要对接生态体系这一模式。我们担心的是,在发展机器之眼的路上,我们能跑多快,以什么样的方式能最快地把产品和服务提供给用户。” 印奇称。

以下为印奇口述:

核心技术三步走

我们公司想要做一个大的生态体系,而每一个生态体系都应该有一个中心思想,这样才能围绕这个点去构建生态链。于我们而言,该生态体系的核心就是我们的智能技术——机器之眼。让机器更智能,使之看得见、看得懂世界,在此基础上,才能实现机器与人的交流,即真正的人工智能。

为实现这一愿景,我们制定了阶段性三步走战略:第一步是Face++,目标是识别人;第二步是Image++,目标是识别万物;最后是Video++,也就是真正的机器之眼,目标是所见即所得,看见就能理解、看懂。

机器之眼其实是一个数据概念。我们现在常见的数据主要来自互联网,无论是交易数据,还是用户数据,都是已经存在的虚拟数据。而我们想做的是来自现实的视觉数据,把真实的物理场景转化为数据。

如果是在公司的环境中,通过机器之眼,把每天发生的视觉场景数据化,就可以知道每个人的工作状态。如果是在一个商店里,通过机器之眼,就能知道客户看到了什么商品,喜欢什么样的商品。把这些传统的在物理世界里不可数据化的东西,变成新的数据维度,是我们需要在第三个阶段实现的事情。

要想把这些物理场景变成结构化数据,就需要让机器能够识别和读懂这些东西是什么,也就是我们第二步要做的Image++。比如,手机和矿泉水,只有当机器看到它们,能很快识别出这到底是手机还是矿泉水时,结构化数据的转化才会成为可能。能够识别万物,是机器之眼最终面世的先决条件。

再往前,即第一步,就是大家比较熟悉的Face++。在识别万物之前,先要识别人。从万物中选出一件用来识别,当然要选价值最高的,也就是人。

在我们的计划里,上述每一阶段用时均为5 年。历经三年发展,目前Face++误识率已降低到万分之一以下。基于对十多亿张人脸图片的学习,这一技术已经成年,可以商用了。现在,我们在继续完善Face++ 的同时,已开始了Image++ 的研发。

打造机器之眼的每一步,其实都是一个打破边界的过程。阿里巴巴拓展的是商业边界,我们拓展的是技术边界,以此让很多从前不可能有未来的商业模式因为技术的变革而变得可能。

生态的构建将是一个自然而然的过程。机器有了眼睛,和人有了眼睛一样,看到、看懂之后的行为并不是眼睛来做的。比如,你在超市看到了一支笔,想去买或者试一试,眼睛起到的作用仅仅是输入,而输出过程需要其他肢体完成。因此它必须形成一个生态,而眼睛必将是该生态重要组成部分。

由于太多场景需要眼睛的输入,这项技术应用范围非常广,所以我们不可能做所有应用场景。于Megvii(Face++ 所属公司)而言,最核心的工作就是把眼睛做好,拿出应用范例,更多应用场景,可由其他企业在生态圈里自行挖掘。

人工何以智能

在技术上,Face++ 其实仿照的是人脑神经元的工作原理,在此基础上,我们构建了一套与后者类似的复杂算法。对Face++ 来说,大脑的基础构架在2012 年就已完成,但这就如同小孩,小孩生出来后,虽然有着成长的可能,但如果没人教他知识或他从不学习,最终就将是个废人。人脸识别技术,在上述架构完成后,需要不停地学习,这样才能演变、进化。为此,我们搭建了“技术—产品—数据”这样一个生态循环链,形成了一个基于技术的生态体系。

最开始,我们做出的大脑可能是一个婴儿的大脑,但通过对几十亿个人脸数据的学习,它现在已经是一个18 岁成年人的大脑了。

Face++ 发展的第一个阶段叫云平台服务,我们推出了一个面向开发者的应用。当你的技术还不够好的时候——不够好不是说在这个行业里不够好,而是说即使你是该行业技术水平最高的,但可能还未达到足够高,很难做C 端产品或使场景落地——需要借助云平台服务这一形式,把技术和品牌先传播出去。

我们用云平台做技术服务,把这些服务提供给开发者,在这一过程中,我在意的不是钱而是数据。平台上的用户把他的照片上传到我们的服务器,我们反馈他一个结果,而这个数据最后都将成为我们提升技术水平的核心原材料。

经过第一阶段数据和技术的积累,就到了第二个阶段。Face++ 因为技术优越,开始提供产品和服务。像美图秀秀、360、联想、阿里等众多企业,在他们开发自己的手机相册或提升拍照功能时,就会想到我们。因为在第一个阶段,通过大量数据和技术的循环互动,Face++已成为国内人脸和图像识别技术水平最高的公司。而在第二个阶段,我们成为了中国最大的人脸识别技术提供商,完成了整个技术生态循环链的打造。

在这一生态链中,Face++ 是怎样进化的呢?不妨拿小孩打比方。我们给机器的很多信号,就像教小孩学的很多东西。一开始,它只见过十几个人的脸,识别能力很弱,会分不清。这就像我给小孩两张照片,然后告诉他这并非同一人,或者给他十张照片,告诉他这些都是黄晓明或者都是范冰冰,把这些数据全部教给他之后,小孩的大脑就会发育,慢慢会懂得这些东西。机器的原理与之类似。

比如,使用美图功能时,把眼睛放大,把嘴巴缩小,让脸形瘦一点等,为能实现这些功能,首先机器要知道眼睛、嘴巴、脸在哪里,它们的轮廓是怎样的,这样才好判断哪里应放大、哪里应缩小。目前我们已有一个基础算法,可以比较准确地找到眼睛和嘴巴的位置,但一开始,算法还没有这么强大,并非所有位置都能找对。比如,眼睛的位置可能会找错,因此用户不满意,他们会自己把眼睛移到正确的位置,而这一点击矫正的过程,就是机器进化的过程。通过如此不断地教它,下一版本就会更准。

数据是基础。在产品使用过程中,用户告诉我们这两张照片是同一人或不是同一人,其实就是在向我们提供核心技术数据。当这一数据足够大,形成了产品,产品又生成了数据,数据的处理信息又已能帮助企业提升技术水平时,一个生态循环就打通了。

关于这一循环,最典型的例子是谷歌。谷歌先有一个搜索技术,然后它把搜索技术做成了开放服务,用户使用时,对信息的点击就成了它提升搜索精确度的最重要数据。

Face++ 也是这样。最初,识别十个人的脸或一千个人的脸,要几个月的时间,速度很慢,但后面就越来越快了。这是一个在技术上层层递进的过程,也是我们最重要的生态链。其中产品、数据、技术并不是独立的三个点,而是一个滚雪球的关系。

听起来似乎不难,但这是一个很有壁垒的行业:首先,构建一个大脑是很复杂的,涉及方方面面,有些是学术圈通用算法,但核心是我们自己内部的算法和专利。这是一个很新的技术,能借鉴的东西不多,需要在做的过程中逐步积累和创新。其次,教机器学习时,也涉及到很多经验。比如,就先后次序来说,应该是教好一类人脸后,再教下一类。另外,人脸学习应有优先级,需从易往难教:首先学习识别年轻人的脸,因为五官分明;之后是老人;最后才是小孩。这些操作细节对最终结果的影响很大。

首推两款产品

Face++ 近期工作重点是,在原有云服务平台的基础上,正式发力商业应用,自己做产品。我们将聚焦两个细分领域,一个是金融行业的人脸认证 ,一个是智能camera,即“摄像头数据结构化+IFTTT”平台。

金融认证是目前我们最关注的。Face++已与支付宝、蚂蚁金服达成了战略合作,另与多家商业银行也达成了合作,形成了联盟,并已着手制定相关标准。

如大家所知,腾讯、阿里都已拿到民营银行牌照,互联网金融近来也很热门,对传统金融体系进行改革已成共识。但在这一改革过程中,从业者们遇到了一个非常重要的问题,就是安全。

金融行业是一个对安全要求非常高的行业,传统银行保障安全的一个重要举措就是面签。用户拿着身份证,去实体银行网点,在柜台把身份证交给营业员,告知所办业务的过程就是面签。面签对时下中国传统银行来说非常重要,是用户办理储蓄卡、信用卡的必需环节。

但对新型银行来说,面签很难实现,而因为没钱建海量网点,也就没办法获取相应规模的用户。但这些颠覆者希望把传统金融行业完全搬到线上,所有程序都在线上完成,那么这时就需要用新的技术取代面签,而这个新技术很自然的就是生物识别技术,人脸识别是其中的重要一环。

未来在互联网上,发一张卡,做一个支付,都将比线下安全,这是跨时代的变化。之前在中国是认证不认人的一种模式,但身份证基本上也仅是大概看一下,是存在安全漏洞的。

在传统金融行业变革过程中,我们希望做到的是人证合一,一个人的生物特征就是他的身份凭证。如能做到这一点,无论是安全性还是便携性,都将迎来一个颠覆性变化,业务模式也将随之一新。这是我们和阿里支付宝以及众多银行的共同愿望。只有在这一全新体系下,新的互联网金融业务才可能出现。否则,如果所有线上金融机构,也都需要线下面签,那就不可能将线上海量用户转化为客户。

Face++ 人脸识别技术已非常成熟。比如,某个人要去做金融认证,需要我们辨别两张照片是否为同一人,一张是十年前拍的身份证照片,另一张是从手机前置摄像头拍的一小段视频中随意截取出来的图片,两者可能千差万别。在这种情况下,Face++ 的误识率是万分之一,通过率达93.4%。这已是一个很高水准。

就金融认证而言,人脸识别的输出的结果基本为以下三种:第一种,确定两者为同一人;第二种,确定两者非同一人;第三种,不确定两者是否为同一人。对于前两种情况,Face++的判断准确率非常高,但如果出现第三种情况,就需要转为人工判断。因此,Face++ 误识率虽然已经很低,但我们仍需继续努力,误识率越低,后台人工成本也就越低。

数据O2O

我们正在开展的另一项业务是智能camera——“摄像头数据结构化+IFTTT”平台。说起来很简单,就是将监控由线下搬到线上。业务可延展领域更多。

因为我们可以对人的行为进行识别,如果在这一行为背后加上结构化逻辑,就能产生不同的应用场景。比如,公司门口有一个智能门禁,在工作场景下,如果智能camera 看到门口站立的是公司员工,就应将门自动打开;如果是一个访客,就应打出欢迎词;如果不是员工但经常在门口出现,这时可能已经有通知保安的必要了。

这项技术的核心点是捕获信息,继而让电脑理解并做出反馈。智能camera 就是把它看到的内容,翻译成机器能够理解的信息,加上一些逻辑设定,最终实现智能化。

“IFTTT”就是这样一种逻辑设定:门禁系统,可以设定为“If 在公司门口识别到公司同事, then 打开公司门禁不用刷卡”。奢侈品门店的VIP 识别,可以设定为“If 在商店门口识别到 VIP 顾客,then 销售经理应给予个性化体贴服务”等。

在办公室场景之外,另一核心场景是商业场景,与之对应的是智能商业。万达正在做类似的事情——智能WIFI,即通过WIFI 手段,甄别哪些是新顾客,哪些是老顾客,他们分别去过哪些商店等,希望以此能把线下客户行为结构化。而我们做的智能camera,对于这种数据的结构化更为精准。无论是万达的智能WIFI,还是我们的智能camera,核心分析的都是客户,客户就是人,在这方面,我们的经验更丰富。

通过给门店布置智能camera,所有客户在门店里面做过的事情,比如他拿过哪些商品,哪些商品摆放的位置比较好,人流是怎么引导的等,都可以精准数据化。当然,还有很多其他领域的应用,但核心点始终都是围绕人本身的身份和他的行为。

通过提供智能服务,Face++ 已获得了大量数据,我们已将其用于提升技术水平。在立足于大数据和服务的基础上,Face++ 受到很多客户的青睐,比如阿里。

之前做云平台时,我们只关注技术和数据,产品是别人的,可能是美图秀秀的,也可能是360 的。因为产品是别人的,所以在数据回收和技术提升上就会不完整,效率也不高。虽然这也是一个必经过程,但在这个阶段之后,Face++ 的技术和数据做得越来越好了,我们已经有能力做出一款属于自己产品了,也就是智能camera 和金融认证服务。

上述两产品,关系十分密切。智能camera 线下积累数据非常慢,回收也非常慢,但从金融行业获得的数据量多且快。在金融行业打磨的技术,可以直接搬到智能camera 或其他智能领域,因为业务虽不同,但很多技术和核心数据却是共通的。我们将此称为数据上的O2O 模式。

在线上,无论是通过云服务还是金融认证服务,我们都能快速收集大量数据,通过数据、产品、技术的循环,提升技术水平。这样到线下,我就能有一个高起点,在推线下服务和产品时,就有了一定优势。如果线下数据生态循环畅通了,企业会发现,Face++ 的线上线下数据是非常互补和融合的。这也是我们设想的业务生态模式。

搭建共生生态

我认为,生态有两种,一种是“食物链”型生态,生态体系中的各个企业和板块,由于存在上下游等内生业务关系,为了各个环节能更好地运转,于是形成了一个紧密的统一体。“食物链”型属于闭环型生态,生态中所有的企业,都是在一个圈子里,如阿里电商体系。

另一种叫“共生生态”。和前者不同,它并非封闭的生态圈,而是开放的生态圈。这些企业都是由于共同依赖某项核心资源而形成生态体系,而随着技术的不断发展,生态体系也将随之不断拓展。企业与企业之间,不像“食物链”型生态一样属于强联合关系,而是一种企业—技术—企业的循环生态,不同的企业共同运用同一种核心技术,运用技术的地方又有着一定联系,最后共同促进技术的升级,技术升级之后又反馈给企业,并不断地拓展生态的边界。如蓝光技术标准生态。

够格去做生态的公司或者能成为生态核心的公司,在我看来,必须要占有某个核心战略资源,如技术、流量、标准、现金等,这样才能吸引其他公司加入,也才有能力带动生态圈的循环。而循环是生态体系能存活的重要条件,无论是内部循环还是外部循环,无论是业务循环还是技术循环,能够在不断循环中自我升级的,才是健康的生态圈。

Face++ 想要做的是第二种生态,希望围绕图像识别和人工智能技术,在未来建立一个以核心技术为轴的“共生生态”。

我们认为,在未来世界,有两个关键词是必须重视的,一个是“数据”一个是“智能”。这两个关键词所组成的产业圈将成为一个庞大的生态体系。而智能的基础核心又来自数据极大量的积累,是根据算法得出来的结果。

Face++ 建立共生生态,既是基于这个两个关键词,又是在帮助它们快速成长。Face++ 的图像识别技术是一步一步,让最普通的拍摄装置都可以成为强大的数据积累工具。一段商场里的人流动向、停留、购买视频等,目前我们可以记录的商业数据,和之前技术所能达到的数据积累相比,是几何倍数的增长。这些大量的数据积累就会成为智能机器做判断的基础,也可以成为“机器之脑”。而另一方面,我们也为智能的主体——机器准备了可以认知世界的双眼,图像识别技术让机器可以把只有人能看懂的图片快速解构为机器可读取应用的数据流,相当于给它们装上“机器之眼”。

所以,我们实现这个生态理想的方法就是,抓住未来的重要关键点,为这些能够驱动未来的关键点提供技术支持。依靠图像识别技术,帮助企业拓展、加强现有的业务,从而吸引大量的应用和企业加入这个技术生态圈。而大量的来自不同领域但又存在内在联系的数据,让技术能得到质的提升。进化后的技术,一方面能再次循环反馈给已经在生态圈的企业,一方面又能让原来不可能的事情变得可能。在此基础上,我们能够吸引更多企业加入进来,最终形成一个更大的生态体系。

版权声明:本文作者印奇,编辑i黑马,文章为原创,i黑马版权所有,如需转载请联系zzyyanan授权。未经授权,转载必究。