这个真的是个很老的技术,如果只是V to T的话,我记得我在用Delphi5的时候就用过一个IBM做的叫VoiceType的开发套件,当时就已经很成熟了,从七八十年代开始基本没有脱离过HMM模型。在90年代初的时候AT&T就做过类似的东西做自动呼叫(VRCP),大概就是在一定功能下替代人工服务的业务。
这里真正难的地方是语义识别的部分,很不巧,这部分无论是技术门槛高还是前期投资都是高的吓人,需要海量的数据和数据处理能力在背后驱动。在现在苹果、微软、Google、AT&T和IBM一大堆的公司都在做的时候,没道理创业公司能够从里面抢到市场。
另外其实现在对这个功能的是没有主动需求的,大多是对现有某些功能的完善,例如对输入需求的扩展,对搜索需求的扩展。无论以后会在手机会在汽车还是会在家里加上这些智能的语音识别功能,更多的是主要产品的提供商自己供应的,像iOS和Android已经有了,因为这些公司只是靠这个功能改善用户体验,对自己现有的基本功能做补充,对于手机公司来说,只是把他们的基础操作方式除了触控之外,增加了一种语音控制。另外像Siri出来之后很多人都是短期对其好奇产生的热度,平时真正很少去用。综上对现在的互联网也不会产生太大的影响,只是多了一种输入方式。
在现有大公司已经做了这么多年,且投入产出不成正比的情况下,这个产业和创业公司应该是没什么关系,谈不上有竞争,更不会被创业公司颠覆。但有可能会产生一定的机会,主要集中在:
可能某些公司会开放他们的语料库,创业公司可能能够在冷门领域抢到市场,例如跟教育或者医疗有关的,别的公司还没有触及的地方。(NTT应该是做过在金融方便的很多应用,不过不了解具体的方向。)
可能某些公司会开放api,某些创业公司可以做一些结合的东西,例如在Siri里做一个语音编程的东西之类的。(现在已经有人在越狱的4S上做这些了。)
PS1:据说Android的语音搜索功能是建立在几年前Google曾经做过打电话搜索的业务,然后记录下来了每个人的录音,后来这个业务被停掉了,但是收集了大量的语音信息。
PS2:我见过国内一个很扯淡做Siri中文版的做法,就是把中文语音转化成英文后用Siri翻译,然后再翻译回来。
——王亚辉
如果技术只对现有产品起到优化作用,则依然是大企业的囊中之物。一般称之为改进性技术
如果技术能形成新的市场和产品形态,创业者机会更多,比如图形界面对于dos界面,触摸屏对于键盘。一般称之为破坏性技术
总的来说,语音识别和语义分析属于破坏性的技术,小身段的创业者更有机会成功。
1 创新需要从小处入手,而非开始就大而全。
最典型的失败案例是摩托罗拉铱星计划,"让用户从世界上任何地方都可以打电话"。高超的技术、全新的卫星系统,但从产品构想到推出耗时11年,再加上超高的价格以及移动通信的崛起,导致它远远脱离市场需求。
突破性创新产品的初期市场很小,无法满足大公司的收入和增长要求,这决定了大公司流程和价值观不会选择创新为主业务,被安排做创新产品的人也会抵触它。小型创业团队的灵活性和生存压力更适配于初期市场的规模。
微软、IBM等大公司在语音上已投入很多年,还没可见的产出,不能因此说小公司没有资源更搞不定。 正是因为大公司从技术出发在做凭空想象的大东西,而小公司一般能从小的市场点切入,能够根据市场反馈持续调整,市场才是最好的驱动引擎,市场会带着小公司走向成功。
2 蛋糕不只是一家或几家公司的。
语音是基础性的创新,会有一家或几家大公司积累了平台性的数据和技术,但最直接并给用户最多价值的,是各种各样的应用,它们是生态系统中最有影响力的部分。
语音技术未来发展可想的几个阶段:
1 作为文字输入的语音识别。
属于改进性。从碎碎念的微博,到长篇大论的知乎、博客,都不会因为语音识别方便输入而产生全新的产品形态。会让微博更随意,随便喊一嗓子就能发,但很难催生新的产品类型。
2 作为交互模式的语音识别。
是破坏性的。说话不需物理运动,解放了人的双手。相对于键盘,甚至触屏,都有明显的优势,是更懒、更自然、更简单的交互方式。比如以下场景:家里有个支持语音识别的控制中心,人懒洋洋的躺在沙发上,想看电视,喊一声,开空调,喊一声,随性所欲。这比到处找各种遥控器舒服太多。再往远一点看,当人工智能成熟,机器人普及的时候,语音是最理想的交互方式,我们像和家人一样和机器人交谈。
3 语义分析
毫无疑问,是完全颠覆的破坏性技术。
让机器听懂人的语言,是只能不断接近的梦想。需要持续的积累大量的数据,数据多一点,优化多一点。
一开始就以完全智能为目标的创新不靠谱。垂直领域、具体场景和局部的创新,会不断涌现,比如今天天气好不好,现在几点钟,哪个饭店好吃。。。。
PS: 再次推荐乔爷喜欢的《创新者的窘境》,对创新的见解很有启发。
——邢壮杰
本文由i黑马作者Michael整理自知乎 由王冉提问:不断发展的语音识别和语义分析技术对互联网世界会有怎样的影响?它们更可能成为大公司屏蔽竞争对手的护城河还是创业者颠覆市场格局的杀手锏?