百度、金沙江创投关于AI的无保留分享:丢掉幻想,准备打仗
2018-09-04 18:00 百度 百度AI加速器 百度风投 金沙江创投

抓紧卡位,只要卡住了应用场景的位,未来就是好日子。

文 | 李夜

9月3日,百度AI加速器Demo Day为第二期学员举办了一场“毕业典礼”, 200多位知名VC投资人和AI企业代表共同见证了学员们的“加速”效果。当天,百度AI加速器还公布了第三期入选企业,并为它们举办了开营仪式。

据悉,百度AI加速器第二期于3月23日开营。据百度AI加速器负责人、百度AI技术平台体系执行总监吴甜介绍,五个月内,第二期成员企业总估值实现了翻番,5家获得了新一轮融资,20余家成员企业在2018年预计总利润同比增长近140%。有11家企业发布了新产品,15家企业实现了原有产品的升级换代,深度服务B端客户2万家,并让数以亿计的C端用户享受到了全新的AI体验。

路演环节,酷家乐、超盟、开为、中云智慧、甘来等优秀学员企业一一登场,为现场观众讲述了百度AI加速器对于产品乃至整个企业的帮助,以及产品落地成果和业绩报告。以超盟数据为例,超盟数据是一家线下零售数字化运营服务商。在加速期间,超盟数据不仅运用百度自然语言处理、知识图谱、用户画像等技术,将数据挖掘的准确率和效率提高了93%-97%,极大地提升了产品及业务能力,还找到了“盟友”,与同属第二期成员的开为科技达成了深度合作。7月,超盟数据和开为科技共同与传统商超企业天天便利签订了战略合作协议,三方共同实现产品与技术的融合、共同服务线下的零售店。天天便利在全国共有260家便利店品牌,98000多家门店。

百度AI加速器第二期学员顺利结业

路演之后,百度副总裁、百度风投CEO刘维,百度AI加速器负责人、百度AI技术平台体系执行总监吴甜,百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤,金沙江创投合伙人杨志伟等参与了“毕业典礼”上的圆桌讨论。百度AI技术平台体系战略投资总监王亮非是圆桌论坛的主持人。以下为本次讨论,内容经i黑马&黑智编辑(略有删减):

一、“抓紧卡位,只要卡住了应用场景的位,未来就是好日子”

王亮非:请几位简单概括一下自己这几年在AI方面一些心得。有哪些瓶颈?有哪些突破?有哪些技术趋势?

杨志伟:个人感觉,人工智能的创业公司已经从基础能力进入到深度学习的变化过程中。早期投资都是投人的。人工智能都是高大上的,所以前期,所有的融资项目都要带一个AI。因为你带上了AI,就高大上了。但那个时候,人才非常稀缺,真正的人才都储备在基础能力方面,比如在算法、深度学习、芯片等领域具备基础能力的科学家。金沙江,在整个基础设施能力方面,投了一些非常出色的企业。

其后,逐渐发展过程中,企业做的更多的是把AI的基础能力应用到各个场景中去。而这也让我们的创业门槛降低了。创业企业真正把关注点放在如何把AI跟场景结合,如何把AI转化成生产力。今天,我看到的每一个案例都非常令人影响深刻。过去,孵化器或者加速器里的项目都是早期项目,几个人的团队,有一个想法,凭着热情就去创业。今天,我看到百度AI加速器里的创业企业,从天使投资到B轮、C轮的企业都有,跨度非常大。这也证明了,百度AI能够把百度在人工智能方面积累的资源、基础能力开放出来,使得创业的门槛不断降低,让大家更加能够聚焦在解决问题上面。这是很好的。

吴中勤:我在百度大脑里负责“看”这一部分,是“看”的技术团队负责人,很高兴和大家一起交流人工智能技术和产业应用的思考。我观察到很多现象,从视觉技术这个角度来讲,最近几年,技术确实有翻天覆地的变化。比如人脸识别能不能做安防?刚才有一家企业也讲到户型图能不能转化为3D?安检的时候X光的图片能不能更好地识别违禁品?

实际上我们看到,技术和产业的结合,能够使得技术的应用和范围,在广度及深度上发生了巨大的变化。从深度上来讲,以人脸识别为例,在2015年,这几家人脸创业的公司可能还没有做到很大规模,百度在最权威的检测和识别上都是世界第一,而且这个第一的成绩保持了一年多,没有人能打破。2015年,我们能在竞赛上都取得了99.6%、99.7%的成绩,但是在今天这种灯光条件下,以当时的技术能力,我们的人脸识别肯定是有问题的。因为在今天现场光照条件下,当时的技术辨别得不是很好。所以我们当时参加那些娱乐综艺节目,去PK选手,要付出非常多的努力,我们的人脸算法才能快速进步。但到了今天,对于我们来说,这样的灯光条件已经不是什么大的问题了。

人脸识别以前用的都是RGB的光照,摄像头里面看最多的是一个视频。但是在今天来看,从去年开始,硬件的优化上来了,可以用近红外图像成像。这跟RGB有不同的特点,技术上有互补。这种互补性,又给技术带来了很大的挑战。我们再看人脸识别,如果集中到安防这个应用(这个产业现在可能比较容易赚钱)上,这些做人脸识别的算法和应用的公司,今年和去年相比,不管是POC还是在抓捕逃犯的过程中,都有巨大的进步。这就是应用场景跟技术互相迭代,而且能够起到非常大的作用。毫不客气地说,人脸识别在安防领域,远远还没有到一个理想的程度。比如POC,大家都把参数调得很敏感,很容易出来。但是实际应用的时候,要把阈值调得非常不敏感。因为不能带来那么多虚假的工作量。另外就是人脸库,原来只能做几万、几千,去年大家能做了几十万,今年能做到几百万,是不是能够做整个中国人口的识别呢?这就是技术和产业互相迭代带来的深度和广度上的变化。这需要技术研发的团队和产业落地的团队一起做。这也是百度AI平台和加速器应该承担的一个使命。

吴甜:我分享两个方面的技术考虑,一方面是深度学习技术平台,另外一方面是自然语言处理、知识图谱等认知技术。

先说深度学习技术平台。大家都知道,这一轮的人工智能创新的缘起是深度学习技术在理论上的重大突破。2006年,Geoffrey Hinton提出了深度神经网络的理论。在这12年里,理论有了突破,技术本身也有一系列的突破。在很多场景下,深度学习技术已经被广泛地使用起来。对于人工智能创新来说,我们看到只是开头而已。大量的场景被挖掘出来。这一系列的场景,都能够看到技术会带给它们的新价值。这是这一轮的技术创新带来的最大魅力。今天,我们看到很多Demo的演示,它们的背后都有新技术带来的一系列新的可能性。这是新技术能够给大家带来的想像力。这背后是深度学习技术,深度学习是最底层、最核心的。随着深度学习技术的大公司在这些平台上不断地投入,不断地开放出更多、更好的平台。其实,这也为我们新的场景创新带来更多新的可能性。相信未来这一块会有很多创新发生。

在认知技术方面,我比较专注做的是自然语言处理和知识图谱。在过去几年,随着深度学习技术的推进,这些认知技术也有一些突破。典型的突破是在自然语言领域里的机器翻译和语义匹配这两个方向。当然,认知技术还有很多未突破的方面,刚才的演示当中,也有多个团队在使用这些认知技术去做,比如对话、交互这些方面的工作。相信大家在应用过程当中会发现,现在的技术离我们能够想像的完美状态还是有距离的。因为这里面还有很多问题尚未突破。没有关系,能够实现出来的那些能力,足以推动一波非常好的人工智能创新了。我相信未来几年,突破还会继续发生。在应用上,由应用所带来的新的技术尝试和技术实践都会有一个前所未有的爆发式发展。在这个过程当中,大量新的价值会被创造出来。

刘维:这些年,我也算是AI创业的鼓吹者,到哪里都说AI创业很有前景。此时此刻,相信这个话题,大家是有共识的。大家都支持AI创业,觉得很有前途。因为一切才刚刚开始。就像中勤说的,AI技术通过过去几十年的蓄势、积累,理论体系和计算能力从发展再到快速成熟,一波波公司融了不少钱,一些大公司也在推动。截止到目前,在一些代价很昂贵、付费能力很强、痛点很足的问题上,AI才能够勉勉强强落地。即使这样,已经诞生出很多商业上很成功的应用。

刚才,中勤提到安防领域。安防是挖得比较深的行业了。截止到今天,仍然只是在反恐这样的一些高价值的场景里。只有在高差错容忍度的场景才能落地。所以,一方面是很多东西进展得没那么快,另外一方面,让我们对未来更是充满信心。本质上,我们做的是赋能型的商业模式。AI创业者不管做硬件,做软件,做SaaS+AI,不管什么形态,最终都是把自己的产品嵌入到一个行业已有的链条中,提高这个行业链条原有的效率。

无论是一个节点还是什么链条,最终是一个效率模型。在效率模型上,咱们这个行业有太多需要提高效率的地方了。就算好不容易都解决了,人力成本上升了,又带来了新问题。就算这些都解决了,我们的物质需求、个性化需求解决了,又带来了新问题。这是没有止境的。这么多要解决的问题,等着AI创业公司给他们服务。反过来讲,AI创业公司自身的效率,又受制于技术还不够成熟。在这样一个分水岭上,我们看到有1%的想法已经开始落地,还有99%的想法靠百度,靠中勤,靠吴甜,靠大家,不断把平台技术、顶层进行的效果进一步提升,成本进一步降低。所以,我跟很多我们投的企业说,这几年,你们抓紧做好卡位,只要卡住了这个应用场景的位,你今天做一个机器人、摄像头、自动化也好,今天甲方能买单,未来就是好日子,因为技术成本越来越低,技术能力越来越强,哪怕甲方再给你打打折,你的利润是越来越高的。创业者在赋能行业,AI的平台也在赋能这一波创业者。

二、“丢掉幻想,准备打仗”

王亮非:我们的主题是AI创业的新机遇。在今天这个时间点上,在技术、创新场景上,还有哪些机遇?在生态建设方面,我们可以做哪些方面?哪些方面,不可以做?

杨志伟:每个投资人Focus在不同的应用领域,我更多看的是2B领域。在2B领域,我们在两三年前,甚至在四五年前,就开始投资赋能线下商家的应用。今天,大家叫它新零售。今天,我们快Close的一家公司是开为科技。它是做人脸识别的。但人脸识别不能算是一个高科技,就是一个Commodity。从人脸识别的哪个角度切入,才会给商家赋能呢?大家一讲到人脸识别、刷脸支付就觉得很时髦。其实,不是说只要有刷脸支付就是时髦的东西。很多SKU的识别也是时髦的东西。

很多时候,在商家的场景里,商家不知道来的人是谁。其实,我并不需要知道你的长相、你的支付,我只想知道这个人是不是经常来的客人,是新客人还是回头客,消费情况如何。但是要做到无感知,我并不需要别人拿出手机我才知道是谁,我希望你走过来,甚至还没有到我跟前,我就知道你是谁以及你的消费信息。希望我们的创业者,知道技术如何赋能给商家。不管这个事情有多大,但它对商家有价值,能顾为客户带来价值。过去,谈到创业,大家讲的是痛点,痛点本身就是你给商家赋予了价值。你实现了这个价值,你的生意就有存在的理由。很多人说我的产品做得很好,我的技术也很高,而且我也有很多的壁垒。但是你所想像的壁垒或者价值,并没有实现这个价值。所以,人工智能相关的投资,不是你用了多深的技术,而是你如何能够为商家创造价值。在新零售领域,有太多的机会。我们投了一系列的企业,比如缤果盒子、开为。

吴中勤:最近,我看到有两个大方向可以思考,一个是怎么样降低行业和产品应用AI的门槛。这是非常大的机会。这里面有两个路径,我们在Research上关注到,这一波人工智能更多是在算法上,通过底层的数据驱动,通过有监督的深度学习,来得到合适的算法模型。这里面存在非常大的门槛和成本,大量的数据从哪里来?对于一个创业者来说,对于一个小型公司来说,很难一下子有大量的数据,大家都只能做特别小的场景,只能从刚开始切入。对广大的创业者来说,如果能够把对数据依赖的成本降下来,这是非常好的办法,也是一个很好的助力。这里面也有很多手段可以改善。比如从技术上来讲,以极小的样本规模来达成较高精度的模型。像BAT这样的企业,应该有这样的社会责任,把这个事情做得更好,所以我们也推出百度AI开放平台去做这个事情。比如开发者大会中,圣象地板案例里,我们可以通过百度已经拥有的几亿、几十亿、几百亿的图片,在背后提供的语义分布,得出地板怎么样才是比较完美的模型。假如你说自己搜集数据,要搜集几百万数据才能达到这样的效果,因为你站在巨人的肩膀上做这件事情就比较简单了。这样的数据,我们平台还不够多,接下来我们会多做努力,降低门槛。

第二个方向是提升我们AI能力、AI技术的内涵。这个内涵也有两个方向。一个方向就是这个内涵本身不仅仅只从算法和数据上做文章,我们多次提到软硬结合,可以在硬件上做很多工作。孵化器的企业,可以跟我们一起协作研究怎么样把人脸检测、人脸识别算法,在传感器芯片上做出更好的效果。一方面成本降低成本,另一方面提升了内涵,因为引入了更多维度的感知层的信息。还有一个提升内涵的方式,我觉得是从现在的感知技术往认知技术上去结合。客观来说,我们创业比较多地活跃在语音、图像。刚才吴甜也说到了,NLP语言理解是非常有挑战的事,我们现在更多地处在机器翻译和语义提升上。但是真正理解每句话是什么意思以及背后的组合需要更多的努力。从感知层输入,并结合NLP的方案,这也是一个很理想的方案。现在,很多公司的解决方案主打组合型的AI技术,是为了通过感知+认知的方法,用这个解决方案去解决具体的问题。比如智能家居领域,大家做智能音箱,从感知+认知的角度,做语音语义一体化的技术。如果是图像,创业者就用视频结构化的技术来解决。,我了解到摄像头在商场里,拍摄到的是一帧帧图像序列。我们能不能够通过分析整个画面的结构把人的体征提取出来,把人跟物体的互动提取出来,把人和品牌、门店的互动提取出来,把每一个商品的进货出货统一起来?如此,看上去是这些像素组合的序列,通过感知+认知,能够变成一个结构化的语义知识,这样就可以通过人和数学,以及计算机能理解的方式变得更有内涵,变成可以推导的东西。

综上,从这两个角度,把AI门槛降下来,一种是从数据上想办法,一种是从平台机制上想办法。再就是怎么样提升我们AI能力的内涵,软硬结合是一种办法,感知+认知结合是另一种办法。

吴甜:志伟从投资行业场景的角度说了,中勤从技术上可突破、可优化的点说了,我再增加一个视角,给最后一位发言者增加一点难度。

打一个比方,大家知道火箭上天。火箭上天的缘起也是有理论突破的,有动力学的突破,火箭才可能上天。但是火箭上天远比理论突破复杂得多。它需要有对问题的定义、工程设计、工艺把握等一系列组合,最后还需要有很强的实施团队,才有可能把一个火箭送上天。现在,我们在谈人工智能可创新、人工智能做什么样事情的时候,我们的关注点会放在核的技术上,忽略掉前前后后无数件支撑的事情。首先,我们对问题的定义要准确。这个问题是一个可实现且有价值的事情。定义了问题,还要把这个问题定义到一个技术可解决的方案上,还要为此标注数据,了解数据的来源,大数据的利用以及小样本的标注是怎么样去做的。最后还要能够有工程的能力实现,还要能够实时部署好,能够跟场景结合起来,才能在场景上真得起作用。这样一整套下来,人工智能的落地是挺复杂的,中间的任何一个环节,如果我们做得不够极致,都不能够带给我们想要的庞大空间和预期价值。

我认为,整个社会处于一个积木式创新状态。整个创新过程是与在社会上众多不同的角色一起通力合作完成的。大家多次提到了,百度会把技术平台开放出来,技术平台的开放只是一系列环节当中的一环。对于落地场景和行业选择上,可能从我们生活角度出发,离我们比较近的那些场景本身就已经具备了大量的潜力可以去挖掘。在整体推动的过程当中,我们会不断发现价值,创造出价值来。

刘维:最后说,就得说点语不惊人死不休的话。丢掉幻想,准备打仗。

丢掉什么幻想?跟志伟他们的观点一样,今天通用的讲一个AI的概念,说我有几个不错的技术人才,恐怕难以奏效。大公司也好,中公司也好,有庞大到大家想像不到的可复用的数据、算法、人才、投资。因为在实际应用场景中,它们在不断高速迭代和奔跑,具备真正的工程化落地的能力。坦率地说,我觉得今天,AI到了一个落地的黄金时期。反过来,光举着AI的旗,举着锤子找钉子的时代已经彻底过去了。前面几位嘉宾也说了,要真走到行业内,去发掘痛点。

打什么仗?机会还是很多的。我们不怕死,越是看上去落后的行业,创业公司的机会就越多。比如工业,为什么选择这样一个行业?大家知道,越是这样的行业,用这些高科技、高效率的手段给人家改善一点点是撬不动这个行业坚固的围墙,撬不动2B、2G关系的壁垒。所以这些行业的小创新是没有办法发生的,走到今天恰恰是效率最弱的。我刚才说的平台技术公司也许自己可以做一部分,但是每一个细分战场都不一样,百度不可能自己跑到每一个工厂里面把系统都建了。这是创业者非常大的机会。正是因为这些行业比较弱,我们可能一开始可能以一个解决方案或者技术提供商切入,切出来的时候,很有可能你可以在这样一个细分场景内成为一个系统供应商或者整体方案供应商。当这个行业的甲方弱到一定程度,弱到你想把好的东西卖给他,他们却欣赏不了,甚至没有付费能力。当我手里有一个特别牛的AI驱动的效率工具和产品的时候,我干脆在这个行业里面找一些最牛的人,干掉甲方或者先做一段时间的乙方再跟甲方重新构建合作。所以越是这样很深的、很传统的行业,我们觉得越有更多的机会。

刚才也说了,要去把握这种机会,要吃很多苦。这个行业是传统行业,你要吃很多苦。这个行业可能连数据采集都没有,数据标准都没有,把这些东西拿上来,可能也要吃很多的苦。这一点跟互联网时代的很多创业观点是相反的。这里面,VP的概念变了,不是最简单的写一行代码,可能是需要凑出一个最小的子集出来,这个最小的子集,可能要从新的数据源做起。我觉得,今天谈CV(计算机视觉),当你要去做行业场景CV的时候,这也是创业公司很大的新机遇。如果你只是拿一个通用的摄像头,采一个通用图片,你说我有一个团队,我的这个图片语义提取能力比中勤强,我相信VC也不感兴趣。他可能说Face++、百度、商汤都没做这个事,可能它们在更高价值场景里做更高价值的事,或者是利用更多的数据训练自己的平台。方案商或者合作伙伴,利用百度的平台一推就很轻松实现了。某种意义上,中勤、吴甜跟你合作,是因为你带有一个他们没有的新数据集来,包括数据的采集、长期积累甚至是预处理、标注等。在医疗和工业领域,我的整体观念都是创业公司往这方面走,碰机器设备,碰硬的东西也是很高的门槛。把这些东西渐渐都垒起来之后,创业公司不断希望有更多的AI能力赋能给大家,横纵结合。我觉得这是非常真实,可以很好地共振。作为VC投资人,我们愿意去投资的也是垂直场景的公司,并且把它们跟最好的技术公司连接,形成共振。