让机器“能听会说更懂人类”, AI数据发挥怎样的关键作用?
2021-04-30 18:50 云测数据

智能语音技术是人工智能应用最广泛的技术之一,拥有天然的交互性,拥有巨大的市场空间。基于大量数据的积累、深度神经网络模型的发展及算法的迭代优化,近年,智能语音技术的识别准确率取得了不断的提升,相关场景应用也是不断深化。这其中,智能语音技术对数据的依赖愈发明显。

在人工智能技术推动下,智能语音具备的巨大的场景落地潜力。在企业和技术的推动下,语音交互技术在智能家居、智能车载、语音助手、机器人等领域取得迅猛发展,迸发出鲜活的生命力。

如今的语音交互虽然囊括了大部分场景对话,但还有更多复杂场景的问题需要解决 —— 听懂人类情感是非常复杂的过程,这涉及到情感识别、语义分割、声纹识别等等,对算法模型训练背后的数据提出了巨大的挑战。

高质量AI数据,智能语音走向成熟的必由之路

从根本出发来考虑,语音交互几乎和手势一样,是人类最自然的交互方式之一,通过声音与朋友家人交流、与客户同事沟通都是人类自古以来的通用场景。语音能够传达的细节相当丰富,其中蕴含了大量语义、情绪以及未尽之意,信息浓度非常高。因此,也可以说语音交互技术是让机器听懂世界的技术。

在这些发展需求商业化落地的背后,必然需要大量高质量、能被机器识别理解的结构化数据投入训练,场景化、高质量的数据让各类终端变得更加聪明。因此,无论出于技术还是商业需求,都需要以云测数据为代表的AI数据服务提供商介入,生产纯净、安全、精准的训练数据,助力智能语音技术深化落地。

云测数据扎根于AI数据服务领域,在服务众多智能语音企业的过程中,积累了丰富的数据采集标注经验,支持专业音频设备与多条件场景,可以帮助企业获得精细化、高质量的AI数据,在智能语音方向拥有丰富的项目经验。

首先,云测数据拥有充足的被采资源,可最大程度还原搭建应用场景,为企业提供语音类、视觉类数据的场景化采集。诸如在采集过程中云测数据会运用专业的软/硬件设备,来满足客户的环境光照要求;如果客户需要纯净音频数据,云测数据会搭建一个录音棚,满足诸如混响或者高底噪的采集需求,包括使用麦克风阵列等专业设备进行录制。

目前云测数据覆盖智能语音主流应用场景,支持专业音频设备与多条件场景,交付能力强。支持常见采集类型,如:唤醒词、控制词、指定语料、情绪类型、方言、背景音、情景对话、指定文本念句、远场语音等等类型的数据类型。

在语音标注能力方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等,具备全方位的语音标注能力。

同时,云测数据具有自主知识产权的数据标注平台拥有灵活、高效、智能的特点,帮助标注人员提效减负。在保证数据隐私安全的同时,支持平台私有化部署,可最大程度保障数据安全性。

在拥有场景化精准语音数据前提下,算法训练所需要的数据精准度就决定了智能语音产品的“聪明”上限,它贯穿在智能语音产品的探索期与商业落地阶段。在人工智能领域中有着这样一句话:garbage in,garbage out。换而言之,数据的质量的高低直接影响语音交互应用的结果,实现人机交互顺畅。

随着技术的不断突破,语音交互体验方面还有望得到进一步提升。比如在设备的唤醒率、识别率、误报率、环境降噪等方面,仍然需要在高质量、场景化的语音数据的助力下不断进化,持续提升用户使用的体验感,创造更加自然的交互设备,实现智能语音技术应用的深化落地。