智能语音市场突围迎来爆发点,谁是下一个破局者?
2019-03-06 13:59 人工智能 智能语音 标贝科技

智能语音市场突围迎来爆发点,谁是下一个破局者?

每一轮科技浪潮的兴起,最先受益的往往是金融行业。自然,人工智能的快速发展,也没能逃过这一定律。

2018年初,恒生电子推出的一款名为“晓鲸”的智能机器人正式登陆央视财经频道《交易时间》。作为一款金融智能投资助手,晓鲸通过语音交互的方式可以为投资者提供全方位的金融信息,获得了众多投资者的高度关注。

微信截图_20190306135407

同年11月份,第五届世界互联网大会上出现了全球第一个“AI合成主播”,该“主播”不仅突破了以往只能单纯创造语音图像合成的技术瓶颈,还配合语音输出实现了唇部模仿真人的效果,观众看到的真实度得到了极大提升。

从智能机器人到人工智能主播,随着技术的提升,应用场景的增多,人工智能行业已经开始展露头角。同时,众多机构对其未来发展也呈现出了极大的信心。

据中国信息通信研究院数据显示,2017年,AI市场规模达到了220亿元,预计其将以48%的年均复合增速发展,2020年将达到710亿元。其中,智能语音在中国人工智能市场中的份额占22%,即48亿元。同时,IDC也曾在2018年10月份的报告中预测,中国对话式人工智能市场规模在2022年有望达到78亿人民币,2018-2022年之间,其市场份额将以57%的复合增速增长。

对此,不少业内人士表示,中国在智能语音领域的发展有可能会超越西方国家,其根本原因在于,中国企业级用户和消费级用户的应用体量在发展的过程中,将会随着场景的深耕而呈指数级增长。正如标贝科技CTO李秀林所说,在某些语音交互场景中,通过科技手段,正逐步实现用户心目中的想象,使得人们对于智能语音的接受度不断提高。基于此,越来越多的场景正在被发掘。

1、应用场景凸显

“您好,这里是xx厂家,我们最近正在搞活动,原价1999的产品现在只卖699元......”。

在不久前,很多人在对面的机器客服还没有说完的时候,已经迫不及待地挂掉了电话。想必大家对这种电话已经司空见惯,但是,这些情况正在发生变化,传统的人工客服比例在近些年呈现出明显下降的趋势,取而代之的是智能客服。比如,我们现在打中国移动或者是一些大型企业客服电话,第一步接电话的多是智能客服,在智能客服没办法解决的情况下,才会把用户导向人工客服。

并且,随着技术的提升,智能客服涉及的行业越来越广且呈现出趋势化发展。据第三方机构Gartner发布的相关评估报告显示,到2020年,全球85%的呼叫中心将进行数字化变革,而人工智能无疑是其中最被人看重的技术力量。

1

这种智能客服之所以能够大规模应用,根本原因则在于它可以有效降低企业用工成本。正如李秀林所说,“专业的客服在服务质量上会比AI系统做得好,但是,专业客服人力成本的不断攀升,给企业带来了不小的挑战。同时,人工智能技术在快速发展,技术水平在迅速提升,在某些领域或场景中甚至接近以假乱真的程度了。因此,越来越多的企业在逐步利用AI技术进行部分替代,在尽量不影响用户体验的情况下,降低相对简单场景下的人力成本”。

其实,不仅仅是成本,工作时间、效率、情绪以及主观理解方面存在的差异,都是制约整个客服行业快速发展的关键因素。而智能语音的出现,会将人力从繁重的机械性回答中彻底解脱出来,在降低成本、提高效率的同时,让客服变成更有温度、为用户带来更高价值的个性化服务。

此外,智能客服也在逐渐融入保险、教育、物流等多个行业,智能客服取代传统的人工客服正在成为一种发展趋势。而智能语音的逐渐普及也在慢慢改变用户思维,生活中越来越多的场景开始涉及到智能语音。

最常见的则是我们在做家务时:“Siri,放首周杰伦的《告白气球》”;在开车时,对着智能语音系统:“开启回家路线导航”;到家后,对着智能音箱:“**,播放一个郭德纲的相声”,等等。其实,人们生活中存在太多无法或者是不愿意利用眼睛获取信息的碎片化时间了,而智能语音的出现正在逐渐填补人们这些碎片化时间。

从企业到用户,智能语音的场景正随着技术的应用而逐渐实现普遍化。

2

2、初创企业逐渐浮出水面

场景应用的普遍化,促使整个行业开始从初期向成熟期快速迈进。虽然苹果、科大讯飞、百度等占据了市场近7成的份额,但是,随着应用场景的拓宽,整个市场规模会不断扩大。而市场不断扩大的前提,除了场景的不断挖掘,还要有足够多的企业参与其中,为行业发展注入更多新鲜的血液,寻求更多的发展空间。

其中,成立于2016年的标贝科技,在3年的时间内服务了BAT在内的50多家企业、服务范围覆盖20余个领域,凭借着个性化的语音合成整体解决方案及数据服务成为了促进行业不断扩大的中坚力量。凭借数据、技术、解决方案的优势,标贝成为了为数不多的完成A轮融资,并且与国内多个领域的巨头进行合作的企业。

从数据服务型公司升级为语音合成技术整体解决方案公司,多年深耕沉淀下来的优质数据功不可没。领先的数据处理能力,不仅开创了TOBI国际标注体系在中国商业领域运用的先河,还凭借着提供高质量、准确快速的数据服务,快速抢占了市场上多个行业巨头客户。

“AI就是数据加上算法加上算力这三驾马车,好的数据对于这些能做研究的公司来说是非常根本、非常基础的。如果数据不好,即便算法再好,它所呈现的效果也不会太理想。所以说,我们在数据质量这块的把控非常严苛”。在谈及标贝的数据时,李秀林这样说道。

拥有了数据处理能力的深厚基础,标贝通过算法+专业的人工数据处理方式,使得其语音合成技术不仅达到了可以媲美真人的地步,还自主研发了一整套的TTS测评系统,帮助客户在短时间内找出问题、原因和解决方法。其打造的“声音超市”,已经可以利用系统化输出,满足不同行业客户在不同场景下的个性化需求。

截止到目前,标贝参与的项目已经多达百项,连续三年保持翻倍盈利。而之所以能够在短时间内取得如此大的突破,除了与数据、技术有着不可分割的关系外,人才也成了助力标贝发展的“加速器”。

标贝联合创始人兼CTO李秀林,中国科学院博士,曾在松下、百度、滴滴等公司工作,有过10余年语音相关技术研发和学术研究经验。此外,整个核心团队在语音行业积累的十五年经验,也成了标贝近些年快速发展最坚实的“底气”。

3、在需求中提升竞争力

场景的落地应用,促使越来越多的企业窥见了语音合成“降本增效”的效果。基于此,越来越多的企业想要利用语音合成技术降低人工处理比例、在高峰期依旧能够应对突发的各种情况,进而实现低成本、高效率的弹性运维。

但是,对于中国大量的中小型企业来说,自行研发TTS系统不仅成本高、周期长,并且与很多创新型企业相比,不具备技术优势。因此,越来越多的像标贝科技这种专门为企业提供语音合成解决方案的公司开始被关注。截止到目前,标贝不仅与百度、阿里、网易等国内50多家巨头达成了合作,还获得了极其看好人工智能行业发展的恒生跟投的5000万A轮融资。

在标贝科技CEO刘博看来,大公司涉足智能语音领域,往往需要做全栈技术,而创业公司倾向于专注某一方面,比如技术,它的针对性会更强。而且,标贝在发展的过程中,通过客户的反馈不断优化服务流程,已经能够帮助众多企业部署更成熟的解决方案和后续服务。

标准化输出,满足用户需求

当用户需求已经出现的时候,企业“产品”只有实现标准化才能同时兼顾规模化复制和成本降低,这不仅是标贝作为解决方案服务公司所追求的,也是众多企业级客户提升竞争力的一个重要因素。只不过,与多数普通产品不同的“解决方案”又是否能够实现标准化输出呢?

“其实,我们现在就是标准化输出,比如我们的合成系统、我们的算法,都有一个标准化框架,我们给客户部署的时候也是标准化的流程,比如他需要哪个声音,我们给他部署上就OK了,这也是我们打造声音超市平台的目的之一”。

“声音超市”是一个可以供用户随时挑选、所听即所得的声音平台。对于客户来说,通过标贝推出的声音超市平台自由挑选声音意味着在明确自己需求的前提下,可以快速实现声音的挑选、合成以及落地场景化应用。这个速度有可能会决定某一公司在激烈的竞争中,能否快速抢占市场以及是否具有可持续化的竞争力。

3

拓宽领域,深层次挖掘用户需求

不同的应用场景,其需要的声音类型也是不同的,这也就意味着不同的行业、不同的用户对于声音的需求是不一样的。而一个企业要想在发展的过程中不断扩大规模,深层次挖掘用户需求是不得不过的一道“坎”。

针对此,标贝一方面推出了声音超市,一方面不断拓宽新领域。目前,平台上的声音类型已经涵盖了可以降低人力成本的智能客服、可以实现语音交互的智能音箱、可以提高生产效率的有声阅读等多个领域的场景应用。

而另一方面,针对每一个场景,标贝还在深化细分领域。比如客服领域,标贝虽然已经与智齿等多个企业达成了合作,但在与客户合作的过程中,标贝发现他们对于客服风格有更多的需求。基于此,李秀林表示,内部现在还在孵化两款不同风格的客服,进而搭配不同的领域。

此外,标贝挖掘了一些传统语音公司认为需求没有那么强但很多互联网企业已经有需求的新领域,比如泛娱乐。

在与一些明星工作室合作推出语音合成方案后,标贝也让众多互联网企业在发展的过程中看到了新商机。通过这种语音合成来拉近用户与明星之间的距离,不管是将其应用在教育、读物还是媒体行业,其变现能力都有较大提升。

技术有望不断突破

虽然用户的深层次需求在不断地被挖掘出来,但这并不意味着智能语音市场已经到了成熟阶段。“我觉得语音的应用场景是没有真正被开发出来的,语音合成市场被开发的也不足十分之一,生活中从电视、新闻到有声读物,大部分还是以人工输出为主,成本是很高的。随着技术的进一步突破,很多诉求都可以通过TTS实现”,李秀林表示道。

其实,在技术突破方面,标贝科技CTO李秀林深耕语音行业十几年,已经进行过多次突破。就以智能语音情绪的丰富度来说,李秀林在百度时,就已经针对内容丰富、感情起伏大、需要很强的情感表达的小说进行过一次情感合成技术上的突破,使得百度的小说频道一经推出就获得了用户很好的反馈。

进入标贝后,其以标贝积累的大量语音数据为基础,通过高精度自动预处理技术对数据进行处理和建模,并搭建了以Attention机制为基础的高质量语音合成系统,给众多企业提供了在声音流畅度、自然度上都更为理想的语音合成解决方案,获得客户的一致好评。

未来,随着技术的不断突破,语音交互方面还有望得到进一步提升。比如,基于对用户的持续学习,它知道你喜欢的东西、爱好、兴趣,甚至可以通过你的行动、表情、语气知道你的喜怒哀乐,这样的话,它会基于你而做出不同的、但是令你感到贴心的反应,且跟你有很多共同话题,而这都是可以基于技术的突破逐渐实现的。

在不断满足用户需求的过程中,标贝也在不断地提升自身的竞争力。接下来,标贝将会在技术人员、场景挖掘、业务规模方面不断投入、探索,利用场景与用户形成生态圈、形成闭环,进而不断实现数据上的丰富、技术上的更新,与众多创新型企业一同,不断推动智能语音产业的发展与创新。

熊本熊
文章评价
匿名用户
发布