三大启明系AI独角兽的无保留分享:如何构建自己的护城河
2018-05-31 15:45 启明创投 优必选 Face++ 云知声

技术不是一家公司的长期、唯一的壁垒,技术只是我们撬动这个行业的起点。

文 | 李夜

立夏之后,启明创投在北京举办了它的第一届“智启社”春季沙龙。

这是一场极具启明创投特色的沙龙,从组织者、主持人(启明创投负责科技创新投资的周志峰)到与会者(绝大多数与会者都是启明创投的被投企业的CEO或CTO),都和启明创投有莫大的关系。

此外,主办方还延请了人工智能业内的领头人,比如微软首席语音科学家黄学东、前金山软件CEO张宏江、京东集团负责AI平台和研究部的副总裁周伯文、腾讯AI实验室视觉首席科学家刘威、今日头条AI实验室负责人李航、平安科技的首席医疗科学家谢国彤等参加了本次春季沙龙。

(沙龙现场图)

这场春季沙龙的核心目的之一,是“志同道合的AI从业者们,一起交流和讨论,启迪心智,共同提高”。启明创投创始主管合伙人邝子平在开场致辞时,回顾了启明从2012年开始系统布局AI的历程,分享了收获与遗憾。他希望多听听大家的发言,“希望本次沙龙既没有特殊的演讲者,也没有听众,大家都参与”。

邝子平的目的达到了。本次沙龙,历时4个多小时,讨论涉及AI底层技术最新趋势和其应用场景等方面。本文只摘录了AI创业的商业模式及其如何突围的相关内容。京东副总裁周伯文、旷视科技Face++的CEO印奇、云知声的CEO黄伟、启明创投合伙人叶冠泰、优必选机器人的CTO熊友军等参与了这一小环节的讨论。他们无保留地分享了如何构建护城河的思考。

(周伯文)

这是本次沙龙讨论的小高潮之一,由周伯文而起。他问了云知声一个问题:一个单向、有深度的技术创业公司能否继续走下去,能走多远?所有的人工智能公司都要变成全能型的企业吗?(注:云知声,在发展过程中,业务逐渐多元,技术能力也从语音拓展到语义,从语义拓展到对话,从对话拓展到针对具体场景的服务)。以下是讨论的主要内容(略有删减):

黄伟:创业公司到底是单点突破还是越做越多?这是一个非常深刻的问题,也是每个CEO应该仔细思考的问题。2012年,我们曾经很天真地认为只要我们把语音识别做好就可以了。很多人也跟我讲,你们就专注去做语音识别,把语音识别做到业界No.1。如果当时我听了这个建议,云知声现在已经挂了。

(黄伟)

为什么呢?第一,语音和语义是不分家的。语音信号包含在信息里面;第二,无论是用语音识别还是用图像识别,用户用的是整个的交互链条。比如我说一句话,怎么把噪音处理掉,怎么识别语音,怎么听到,怎么去理解,怎么去听懂,听懂之后怎么把你想要的东西做聚合,这是一个完整的闭环。如果只做一点,这意味着其他环节需要别人来帮你做。谁来帮你做呢?没人帮你做。

技术点,并不是孤立的。一个公司去做麦克风处理技术,信号处理完后,需要考虑的是怎么跟另外一家语音识别公司进行匹配呢?彼此都是黑盒子,是没法打通的,不能保证效果的。一个比较理想的情况是,有一个公司或者一两家公司能够合作,把整个闭环的端到端打通。一开始,我们只做语音识别,后来发现不行,我们还得做语义理解,做完语义理解还不行,我们还得去做知识图谱,甚至还要去沟通版权、做内容聚合。对我们来说,任何一个环节不做,结果就是nothing。因为用户要的不只是语音百分之百的精准识别,他们要的是能解决具体问题的服务,我们必须把整个服务链条做好。

这是一个痛苦的选择。能力拓展,意味着你要投入资源。这个市场上又没有那么多优秀的人才加入创业公司,对创业公司来说,如何突破是一个非常艰难但又不得不做的选择。我个人认为在市场里,创业公司要么占一个垂直领域,要么在技术链条上下苦工。前者,或许你的技术宽度不够宽,但是在场景里面扎得足够深,你可以活。后者,十八般武艺你都会,你可能活得更久一点。

叶冠泰:我想跟进一个问题,我们跟创业公司聊的时候,经常说大家要专注,要做得深,您现在说做得广非常重要,不然就挂掉了。优必选做机器人,终极目标是做走进千家万户的智能人形机器人。你觉得优必选是什么东西都要自己做吗?

(叶冠泰)

黄伟:我觉得专注是一个相对的词,比如在PC互联网时代,你只要专注做好一个网站就够了。在移动互联网时代,一个创业公司做的事情比PC互联网时期要做的多得多。IOT时代,你会做得更多。面向IOT时代,我觉得云知声和旷视科技今天所做的远远不够,因为未来的场景足够大、足够复杂。

像优必选,他们做的是人形机器人,不见得所有的东西都得自己做,云知声也不见得做完所有的东西,但是关键点是需要自己做的。因为你要确保整个服务链条是能够跑通的。优必选做机器人,可能会把一些听觉、视觉的技术外包,但是它不会把机器人拆成18个零件,每一块都交给一个合作方。所以,我觉得专注是相对的概念,多跟少也是相对的。

叶冠泰:优必选对专注是怎么想的?

熊友军:创业公司怎么去建自己的护城河,在这一块,优必选走过很多弯路。早期,我们活得非常辛苦。2008年,我们开始准备做机器人。那时候我们的特长是在运动控制方面。当时,我们做机器人,不用自己做元器件,我们去买供应商的,从韩国、日本、德国进口了伺服,再结合着我们擅长的运动控制系统,把样机做了出来,效果还不错。但是,等到我们去规模化生产的时候,发现成本太高了,一个伺服成本差不多要7、8百元,一台机器人需要24个伺服,成本约近2万元。成本太高了,根本没法产业化。机器人要进入普通家庭,成本超过三千元是比较困难的。

(熊友军)

于是,我们开始专注做伺服、做舵机,2008年到2012年,我们用了4年时间做舵机,2012年,才把它做得比较稳定、可靠,而且价格远低于韩国、日本,性能还比他们要好。

关于构建护城河的问题,首先我们要找到“城”在哪里。运动控制是优必选成立之初的核心优势,但实际上仅凭这一点,根本没有办法把公司撑下去。深入到机器人这个领域后,我们才知道这个行业现在缺的不是运动控制的算法,直到我们找到了真正的核心技术难题,解决了伺服系统之后,才在2012年注册成立优必选公司,并推出了我们的第一款产品。

第一款产品推出之后,市场反响平平,包括我们自己使用也觉得差强人意。问题出在了机器人跟人的交互上。为了解决这个问题,我们就去找了很多做语音语义的公司,包括云知声和科大讯飞等。我们跟科大讯飞合作,把它们的语音交互系统跟机器人结合起来,推出了第二代语音交互机器人。问题又出现了,我们发现用户在跟机器人交互的时候,机器人需要识别情绪和情感、及人的身份,还需要触摸和避障,需要各种各样的知识。我们发现太多的东西需要被拓展。

一步一步走过来,我们发现只有真正深入到行业,真正去做用户场景,了解客户的需求,才能找到自己的核心,才能知道如何搭建自己的护城河。如果脱离行业、脱离产品、脱离客户需求谈护城河,我觉得这是不现实的,甚至是错的。

周志峰:请问一下印奇,在机器视觉领域,国内几家领先的人工智能公司,以人脸识别算法为例,在LFW等类似的计算机视觉比赛中都取得99.xx%的识别精度。每家公司相差不过0.1% - 0.2%,这是不是意味着在图像识别这一块,我们可以认为AI算法已经趋同了。在这种情况下,如何构建自己的竞争力呢?

(周志峰)

印奇:周总的问题应该放在最后,问完了,我就可以走了。刚才的讨论很精彩,我觉得我们跟云知声是两个挺有意思的AI技术主赛道。我们有很多类似之处,一开始,讲的都是技术平台的故事。我们讲的是视觉技术平台,他们讲的是语音技术平台。越走越觉得自己走不通。在不断的进化当中,我认为优必选实践出了很好一条路径。大家不要再觉得我们估值高,优必选的估值更高,还有在场的今日头条,大家可以多向他们请教融资策略。

优必选估值高是有理由的,刚才熊总讲的最核心的点是“城”在哪里的问题。所有技术驱动的AI创业公司,单点技术一定不是城。之前去日本,我看了一圈日本的机器人公司,很多技术在国外很成熟,这都不是城。优必选为什么值几十亿亿美金?本质上,它已经走完了一个闭环。优必选的核心是在机器人整体产品的能力,以及品牌、市场、销售整体运作能力。对于企业来说,我觉得有两类的选择,一种是小城,另一种是大城。如果我们想做一个小而美的公司,像在场的长亭科技,在网络安全这个细分领域里,是可以选择在早期走小而美路径的。我们旷视科技在巨头参与的主赛道(机器视觉赛道)里,是没有选择的,要么挂掉,要么在一个固定的时间窗口中做大。没有其他选择。我们所解的这个命题是在一个固定时间段里怎么做大的问题,起点在哪并不重要。我认为,技术不是一家公司的长期、唯一的壁垒,技术只是我们撬动这个行业的起点。

回到城的话题,在C端,城一定是产品。没有用户,其他都不是城。在B端,现在,我们在做B2B2B,甚至B2B2C,我认为只有在某个细分行业中体现出你的终极价值,才能够说这是我的城。我觉得,所有的AI公司应该不断往前冲,拿到你的用户价值,提供各种闭环的解决方案。

(印奇)

另一方面,技术为什么是很重要的?技术是你去攻城略地时,你能比别人稍微跑得快那么一点点的核心区别。我们不断请最优秀的人提高我们的系统,并获得更多的数据,这是在阶段性获得技术的差异化的能力。我认为我们的核心差异还是体现在选行业和场景上。

回到黄伟说的逻辑,公司是应该专注的。我们中间有一个阶段是不专注的。因为我们要融资,需要告诉别人Face++是一个平台公司,因此我们进入了很多的行业。今年,我们更加自信一点,要做减法,从原来的四五个行业减到三个行业,明年或许还会更少。我们本质上是从从一个行业切入进去市场,要么从终端的硬件核心元器件切入,要么从上层业务和应用场景切入。大部分AI公司,基本上是从中间技术层切入的,切入之后,你要迅速选择一个方向,我觉得一定要尽快跑到一个端上,要么接地,要么上天。

我们这个行业竞争很激烈。跟同类型的公司相比,我们发现大家选的路径是不太一样的,我们在做“少”,其他公司在做“多”。当我们做少的时候,作为技术背景的团队,我们会变得更安心一些。我们无论是选择现在的三个场景,还是明年的两个场景,如果销售额能够乘以10,这代表你真正构建了属于你的壁垒。但,这是一条非常艰辛的路。