服务大型金融机构,经受上万坐席考验,聊一聊AI工程化落地最佳实践!
2021-04-27 11:42 容联云

当前,AI在金融行业的应用落地上,智能客服与联络中心是最为成熟的,容联云AI服务众多大型金融机构的营销与运营体系,经受上万坐席考验,近日,内部访谈了容联AI实验室及工程化团队,聊一聊AI工程化落地最佳实践。

本次对话干货满满,揭秘AI在大型金融机构落地的过程、效果与未来趋势。

主要探讨问题:

1、未来金融机构的AI图景

2、AI如何在技术侧服务金融机构?

3、AI的投入分别解决金融机构哪些痛点?产生什么效果?

4、除了算法算力的工程化,AI的运营有没有可复制的方法论?

5、AI赋能下的企业数字化是什么样子的?

未来金融机构的AI图景

未来趋势一:横向拓宽,从单一应用切入,做智能化矩阵

过去大部分金融机构布局智能化从一个单点——外呼机器人作为抓手切入整个智能化市场。

随着金融机构数字化的不断深入,单一应用不能完全满足营销与运营体系建设,也催生了从过去做单一应用,开始向智能应用矩阵发展。

除了外呼机器人,还有导航机器人、坐席助手机器人,陪练机器人等,还有多渠道接入的客服性机器人等,这都是从不同的场景出发,来满足客服中心横向发展的一些应用化的产品。

总结:金融机构无论是对CC还是AICC的采购或选型不是为了做单一应用,做单一应用称之为烟囱式的做法,未来会基于平台会做出更多符合自己业务场景的应用性产品。

未来趋势二:产品顶层设计——从应用到垂直化平台

这几年金融科技口的人员,对AI的理解、AI的落地场景的探索也越来越深,企业考虑的不单单是能否解决问题,也要考虑技术架构的前瞻性,拓展性和合理性。

一套系统的建设在企业通常是要花很大的人力,财力去建设的,一旦运行之后,必然要求稳定和灵活兼具,但是可靠性和灵活性是在架构设计之初就决定了的,在生产和测试阶段再考虑就非常困难了,这个是基石,做不好的话,再往上走,做的越多犯错的风险就越大。

另外,大型的行业客户IT技术架构跟互联网的IT架构风格还是有所不同的,核心的几个点,比如:安全、灾备、容错等有较大的区别,所以,设计的时候也不能一概而论,还要结合产品的市场定位来考虑。

过去完全依赖售前去做咨询服务,再去做应用落地,未来这种方式在真正落地AI的时候将非常痛苦。

在这种大的背景下,我们建议可以做两个布局:

第一:可以把通讯/呼叫等联络层和AI能力做一个整体分离,通讯解决沟通、连接的问题,AI解决智能化、能力输出的问题。

第二:对于产品顶层设计,我们建议做框架性的设计,一平台+N中心的架构。

AI其实有一些非常共性的技术,还有一些数据运营的方法,每一个应用如果从0~1做工程搭建是极其耗时耗力的过程,创新的成本也是极高的。

可以打造一个完整AI的中台,同时还附带多个中心,比如应用中心、知识中心、数据中心。在这些中心里,提供比较完整的运营方法论,以及将运营方法的落地所需要的一系列的工具,包括数据爬取,数据清洗,还有数据标注、标签分类等。

搭建AI中台,可以考虑跟AI相关的能力组件、应用支撑性的运营工具,做能力性的下沉,放进中台,同时也将一些数据标注、数据清洗放进中台,从自下而上形成整个AI平台化的架构。机构可以借助这个平台化的工具,快速实现应用场景的落地,避免了完全从零开始的重复工作。

这也是容联云AI kernel诞生的初衷,我们称之为AI kernel云梯平台,助力企业向平台化建设转型。

搭完AI中台之后,可以快速沉淀一套算法能力,一套数据运营方法以及一套训练发布平台。对前台的应用来讲,可以快速和底层本地进行集成,无须关注各种算法调参和模型评测,同时,通过应用来结合企业业务场景来做快速的落地。

总结:通过构建一个AI中台来沉淀一些共享式的服务,然后提升服务的复用率,打破这种烟囱、项目制之间的集成或协作壁垒。能快速降低潜在业务的一些试错成本,赋予业务快速创新的能力,然后能最终提升企业的效率。

技术与实践Q&A

Q:除了应用和平台,AI如何在技术侧服务金融机构?

第一,构建从应用到对话引擎,到NLP引擎这种算力算法的一体化解决方案。

我们要再做垂直领域更深层算法的拓展,实际上除了NLP常规的包括分类,聚类,知识推荐,文本摘要,长句压缩,分词词性,词向量等这一系列单项任务之外,容联也一直在探索知识图谱的落地。

但我们并不像业界的二维表格来做,我们是真正基于知识图谱,三元组的实体提取,实体之间的关系建立,然后再到图库的展示,我们会做一整套的技术底层的实践和落地。有了这些技术之后,再考虑把这些技术应用到对话系统里面去,形成一个完整的KBQA的应用,让它们能完成包括多维度,多渠道支持的输出,这样能丰富整个应用场景,同时也能带来更好的体验。

第二,提供机器标注和反向推荐的一些算法。

在去做数据标注的过程中,可以通过机器初标和知识反向推荐算法来辅助人工,快速的进行标注,不需要完全的从头到尾的去做标注,同时,在算法这一侧,我们一直在解决一个什么问题呢?过去,我们一直在说AI是离不开大数据的,但其本质原因就在于AI现在的深度学习需要大量的数据。自从Google推出transformer这种模型之后,它有了预训练模型之后,所需的数据量大大在减少,每一个标签仅需要少量样本就可以搭建初版模型进行系统冷启。

我们现在还有一个思路来完善语料积累,就是通过文本生成的算法来辅助数据标注人员。在人工少量标注的情况下,进行标签的扩充,再通过聚类算法整合发散语料,不断反复这个过程,能快速适应新场景,同时保证维持模型的效果。当然我们还提供了数据增强方法,结合我们自己的词库、相似问库不断扩充语料的多样性和丰富性,通过机器做了大量前期工作,人工的工作量自然就降低了。

Q:很多机构的痛点是投入很多人维护话术,能否用技术手段来解决?

我们的AI实验室在这个方向的一些探索给出了答复。技术上可以通过情感分析SPO三元组细粒度情感标签建模,对历史话术做筛选,前期需要少量做标注,然后训练,重复这个过程,模型会越来越好。使用模型对话术进行分类,评分,聚类,聚类之后话术多样性也出来了,但是优秀话术不等于成单话术,关键是对成单话术做关联关系的挖掘,得到不同情况下的优秀话术,推荐系统也依赖模型评分做排序,在通过显式采纳和隐式采纳不断反馈给模型做训练。

Q:什么情况下该上AI?什么情况下不该上?有没有一个边界指标?

绝不贸然上AI,充分了解当前技术的上限,做出完美匹配方能成功落地

从NLP应用角度看,对话是目前最为流行也是相对成熟的领域,市场上有很多服务商做对话,但真正要做好是非常困难的。除了搭建好对话系统经典架构,比如:NLU,DST,DPL,DM,NLG等独立子系统,特别是对话策略模块要花特别长时间打磨,同时,还要考虑结合当前技术上限以及用户的使用下限。

比如说,外呼机器人,机器人跟用户对话的意图理解准确率和整通电话所能达到的通过率有个最低要求的,比如:单轮理解要求大于95%,整通对话通过率不能低于85%。如果单独讲在技术上做到98%,实际落地却无法达到用户要求的最低指标,这个无法落地的,或者说落地也是毫无价值的。

当然还有坐席辅助场景和智能陪练场景下,话术推荐和思路导航的准确率也是有个最低要求的,甚至还要跟过去人工业务指标对比,如果人工比AI强出太多,都不足以弥补减少人工带来的成本节约,或者在营销场景下AI对业务实际转化率跟人工差距太大,这个时候是不能贸然上AI。

所以对话目前一定是在限定领域限定场景的任务型对话系统,背后依赖场景数据和VUI收敛问法、业务话术库的支撑才能达到用户的要求。

Q:这些技术在实际应用中产生了什么样的效果?

AI已经真正成为银行催收部门一个生产系统

比如说催收场景的催回率,人工过去的催回率是多少呢?业界有一个标准,在M1一M2阶段大概在70%左右,这是一个相对比较合理的,因为前期人工提醒居多,大概维持在这个水平,那现在AI的催收,已经基本快逼近这样的数字了,这样对比下,AI的价值就非常大了。

拿我们在服务某大型银行举例,整个AI的座席人员,技术上称之为并发数,已经突破了2000席,AI已经真正的成为银行催收部门一个生产系统,用它来进行生产,会带来极大效率的提升,替代了过去银行在M0一M1这个阶段2000席BPO外包,带来极大的提升。

营销线索路径标签化后推广成功率大幅提升

具体到某个环节的改善,比如说营销线索的路径标签化。简单来讲,在营销环节,为客户去做用户画像的标签,对二轮筛选就会有很大的提升。

比如说我们在某大型保险公司实施百万医疗险营销场景的外呼任务,目前的并发路数已经到了600多路,过去百万医疗险人工座席的推广成功率在7%,现在AI已经可以做到5%,这就是用AI筛选出来的,再用人工去跟进,基本也能跟人工去持平,但是会节省了大量的第一次筛选的工作。第一次筛选的工作反复的高挂机率会极大打击人工坐席的信心和情绪,因此,人机协同模式在保险营销场景得到了极大的推广。

有了AI指标,再结合业务指标,两个指标一旦做了平衡,比如AI指标准确召回已经达到了双85或者双90,这个时候AI在生产方面就能带来极大的效率提升,这也是企业会为此买单的一个重要的原因,也是AI落地的最佳实践。

Q:除了算法算力的工程化,AI的运营有没有可复制的方法论?

AI不运营,效果=0,有章可循,有迹可查

我们一直在强调AI和运营目前这个阶段其实是密不可分的。因为我们处的这个时代,虽然说赶上了AI的第五次浪潮,但是AI技术本身,还是有比较明显的短板,背后其实离不开大量数据的支撑。

如果我们做一个测试,在现在的预训练模型之下,大概在50~100条或200条这样一个数据的测试下,会发现在算法基本保持一致的情况下,50条数据大概有一个初版模型,没有经过任何优化,就能达到接近80%。放100条语料之后,马上就越过了85%,当放到200条的时候,跃升到90%。

AI在运营过程中要有数据的支持,用高质量数据提升算法指标来的最为简单和直接,甚至好过了算法调参的各种诡异表现。因此要不断的去做数据的回流。所以运营工作在AI智能化趋势上是极其重要的,甚至说比算法可能还要重要。这部分可以形成一套AI落地的方法论。

这样特别像一个咨询公司做的事情,他们可能会输出一套咨询理论,其实运营方法就是AI的咨询理论。这套理论是有章可循,有迹可查的,不是凭空来的,也不是包装出来的,是可以输出也是可以赋能,辅助现在的AI算法,形成一套相对比较完整的数据运营方式,这是从算法之外,工程之外,做智能化产品最大的一个收获。

Q:现在都在谈企业数字化,AI赋能下的企业数字化是什么样子的?

企业数字化到底在数字化什么?企业本身在经营过程中以及流程制度执行过程中就会会生产有很多的数据,比如:企业的人事管理,名册,客户资料,知识库,wiki等很多知识和数据,但这些知识都没有有效利用起来,都是割离的。但如果围绕NLP技术进行语义的理解与挖掘,就可以帮企业去整理构建结构化知识,有了结构化知识,就可以落地很多有价值的应用场景,甚至说可以直接基于企业文档阅读理解,做检索和查询,然后再对接到对话机器人,以它为窗口可以去横跨企业的很多业务。