科大讯飞其实不像Siri,更像是为苹果公司提供技术支持的Nuance,它的定位是语音技术提供商。讯飞与中国移动越来越紧密的合作,势必会让在已经在智能语音识别系统上领先的讯飞更快发展。
科大讯飞其实不像Siri,更像是为苹果公司提供技术支持的Nuance,它的定位是语音技术提供商。讯飞与中国移动越来越紧密的合作,势必会让在已经在智能语音识别系统上领先的讯飞更快发展。
一年前,也是在广州,2012中国移动全球开发者大会上,中国移动联合科大讯飞推出了的智能语音产品“灵犀”。一年后,还是在广州国际会展中心,在2013中国移动全球合作者大会上,科大讯飞副总裁江涛在12月18日下午发布了“灵犀”的新特性。他重新强调了智能语音识别就是一个人机交互的媒介,而后展望了“灵犀”未来拓展的几个领域:智能穿戴设备、车载蓝牙、WebApp(基于web的系统和应用)。
发布结束后,i黑马对江涛做了专访。他对智能语音识别系统的未来很乐观,相信智能语音识别技术是未来人机交互的发展方向。以下是江涛口述内容摘要:
灵犀与讯飞语点合并,市场占有率已超60%
我们已经统一把讯飞语点在往灵犀上面转了,不再做左右手互搏了。讯飞语点有很多手机厂商定制版,加起来四五千万用户,市场占有率超过60%。灵犀本身的一个推广方式就是通过中国移动的定制机来推广,今年8月份开始全面预置,现在量也逐步起来了,明年就会有一个爆发式的增长。我们现在在逐步地做合并的工作,大概在明年完成。
和其他智能语音识别公司相比,讯飞的优劣
商业模式上:
智能语音是一个改变用户使用习惯的东西,让用户接受这种方式需要一个漫长的养成过程。讯飞有能力和体量做下去,中国移动也有足够的实力,能保证我们有能力长期做下去,不可能像游戏一样,短时间迅速盈利,所以创业公司做这件事情不是很容易。
核心技术上:
这几年随着DNN(深层神经网络)技术的普及,越来越多的公司在比较安静、环境配合的情况下做出识别率较高的系统,但在嘈杂、网络不稳定、有口音等复杂情况下就打折扣。这是我们的技术优势比较明显的地方,如在抗噪性、口音的适应性等方面。
挑战:
挑战不是来自竞争对手。灵犀这种产品模式刚刚起步,主要的挑战还是用户习惯。确实,不少用户还是不习惯对着手机这么讲话,很多人理解是因为私密性的原因,其实不是。周围有人时,你该打电话还是打,因为你觉得对面有一个人,但是用语音识别系统时因为对面没人就会觉得比较别扭,这其实还需要一个培养的过程。
我们在后台运营时,也发现用户使用的频率越来越高了。我们在大方向上(做语音识别系统)还是很坚定的,就像一战的飞机一样,虽然不会改变战争的结果,但是一定是未来的方向,我们相信这一天会到的。
所以4G非常有意义,李总(中国移动总裁李跃)解释过,有时对着手机说了半天没成功,就是在网络传输过程中丢包,如果网络传输快了,一瞬间就能完成交互。说实在的,在大数据的时代,数据越多,信号传递就越充分,无论语音识别还是声纹识别都能更精准,更有表现力。
《创业家》杂志曾在今年的六月刊中详细报道了国内的语音识别技术的现状,详细内容点击: