灵犀发布新特性,科大讯飞能做成中国的Nuacne吗?
2013-12-18 20:14 灵犀 科大讯飞 中移动 江涛

科大讯飞其实不像Siri,更像是为苹果公司提供技术支持的Nuance,它的定位是语音技术提供商。讯飞与中国移动越来越紧密的合作,势必会让在已经在智能语音识别系统上领先的讯飞更快发展。

科大讯飞其实不像Siri,更像是为苹果公司提供技术支持的Nuance,它的定位是语音技术提供商。讯飞与中国移动越来越紧密的合作,势必会让在已经在智能语音识别系统上领先的讯飞更快发展。

 

一年前,也是在广州,2012中国移动全球开发者大会上,中国移动联合科大讯飞推出了的智能语音产品“灵犀”。一年后,还是在广州国际会展中心,在2013中国移动全球合作者大会上,科大讯飞副总裁江涛在12月18日下午发布了“灵犀”的新特性。他重新强调了智能语音识别就是一个人机交互的媒介,而后展望了“灵犀”未来拓展的几个领域:智能穿戴设备、车载蓝牙、WebApp(基于web的系统和应用)。

发布结束后,i黑马对江涛做了专访。他对智能语音识别系统的未来很乐观,相信智能语音识别技术是未来人机交互的发展方向。以下是江涛口述内容摘要:

灵犀与讯飞语点合并,市场占有率已超60%

我们已经统一把讯飞语点在往灵犀上面转了,不再做左右手互搏了。讯飞语点有很多手机厂商定制版,加起来四五千万用户,市场占有率超过60%。灵犀本身的一个推广方式就是通过中国移动的定制机来推广,今年8月份开始全面预置,现在量也逐步起来了,明年就会有一个爆发式的增长。我们现在在逐步地做合并的工作,大概在明年完成。

和其他智能语音识别公司相比,讯飞的优劣

商业模式上:

智能语音是一个改变用户使用习惯的东西,让用户接受这种方式需要一个漫长的养成过程。讯飞有能力和体量做下去,中国移动也有足够的实力,能保证我们有能力长期做下去,不可能像游戏一样,短时间迅速盈利,所以创业公司做这件事情不是很容易。

核心技术上:

这几年随着DNN(深层神经网络)技术的普及,越来越多的公司在比较安静、环境配合的情况下做出识别率较高的系统,但在嘈杂、网络不稳定、有口音等复杂情况下就打折扣。这是我们的技术优势比较明显的地方,如在抗噪性、口音的适应性等方面。

挑战:

挑战不是来自竞争对手。灵犀这种产品模式刚刚起步,主要的挑战还是用户习惯。确实,不少用户还是不习惯对着手机这么讲话,很多人理解是因为私密性的原因,其实不是。周围有人时,你该打电话还是打,因为你觉得对面有一个人,但是用语音识别系统时因为对面没人就会觉得比较别扭,这其实还需要一个培养的过程。

我们在后台运营时,也发现用户使用的频率越来越高了。我们在大方向上(做语音识别系统)还是很坚定的,就像一战的飞机一样,虽然不会改变战争的结果,但是一定是未来的方向,我们相信这一天会到的。

所以4G非常有意义,李总(中国移动总裁李跃)解释过,有时对着手机说了半天没成功,就是在网络传输过程中丢包,如果网络传输快了,一瞬间就能完成交互。说实在的,在大数据的时代,数据越多,信号传递就越充分,无论语音识别还是声纹识别都能更精准,更有表现力。 

《创业家》杂志曾在今年的六月刊中详细报道了国内的语音识别技术的现状,详细内容点击:

谁是中国Siri

云知声:挑战语音识别

智能360:只做语义解析

虫洞:专注人工智能

快说:盯紧垂直市场