平安科技基于NVIDIA RIVA、NEMO平台打造高精度智能语音客服系统

作者 英伟达中国

案例简介

•   本案例通过NVIDIA RIVA平台,平安科技智能服销应用组自主研发了智能客服系统,集成了语音识别、语音合成、语义理解三大智能引擎,以智能语音机器人替代传统的真人客服,实现自然的语音人机交互。

•   本案例主要应用到NVIDIA RIVA平台、NVIDIA NEMO模型训练平台。

Case Introduction

•  In this case, through the NVIDIA RIVA platform, Ping An Technology’s intelligent service sales application group independently developed an intelligent customer service system, which integrates three intelligent engines: speech recognition, speech synthesis, and semantic understanding. The intelligent voice robot replaces the traditional human customer service to achieve natural voice and human-computer interaction.

•  The major products utilized in the case are NVIDIA RIVA platform and NVIDIA NEMO model training platform.

客户简介及应用背景

平安科技是平安集团旗下的全资子公司,运用人工智能、智能认知、云计算、区块链等技术,实现对平安集团旗下的产险、寿险、银行、医疗、智慧城市等金融业务的赋能,是全球领先的高科技金融技术公司。

智能客服系统是平安科技自主研发的基于AI人工智能技术的算法平台,为保险银行等金融业务提供了业界领先的智能问答技术服务。智能客服系统每天会产生海量的语音数据,平安科技通过NVIDIA NEMO + RIVA平台实现了对非结构化的语音数据的结构化高效处理,并应用于语音算法模型的自动化训练。通过RIVA平台,打破了原先传统模型各个组件单独训练的限制,极大地提高了算法模型训练的速度和效率。

客户挑战

智能客服坐席系统通过AI人工智能技术代替原有的人工坐席,从而能够达到降低人力成本、改善服务质量、最大化客户资源利用率,帮助客户快速定位需求。平安科技原有的传统技术依赖于非常多的子模块,以ASR语音识别技术为例,传统模型需要分割成数据预处理,声学模型、语言模型、文本字典、上下文相关模型等多个部分。多个子模块不仅需要大量的人力成本去开发和维护,模块之间的级联误差也会大大降低模型的识别准确率。与此同时,传统模型是单个服务器部署模型,而实际的业务场景,坐席的通话数量每天都会发生变化,很难做到和业务需求量进行算法模型资源的同步,造成业务空闲时大量的GPU资源的浪费。另外,现有传统的ASR语音识别、TTS语音合成、NLP语义理解技术都是基于各自的技术框架,并没有形成统一的算法平台。

应用方案

基于以上遇到的挑战,平安科技采用了NVIDIA RIVA和NVIDIA NEMO平台来提供技术支持,很大程度地解决了上述的问题。

平安智能客服坐席系统引入了由NVIDIA NEMO平台训练的QuartzNet模型。QuartzNet是由NVIDIA提出的基于全卷积的端到端语音识别模型。端到端模型把原来传统模型的各个子模块都整合在了一起,将算法模型的训练速度提升了5倍,算法的识别率提高了5个百分点。高效的模型训练可以把算法模型应用到更多的业务场景中,从而带来更大的业务价值。

此外,平安科技还利用RIVA平台实现了容器化的算法部署,并且实现了弹性伸缩的技术。弹性伸缩技术可以根据业务的需求量动态地调整算法引擎的实例数量,关闭不必要的GPU机器资源,从而节省了大量的机器成本。

与此同时,RIVA平台还整合了ASR、TTS、NLP三个智能算法引擎,使得整个平安科技智能客服坐席系统实现了技术底层的统一。RIVA平台还和平安科技联邦Occam平台进行了整合,在NVIDIA推出的 BERT 推理解决方案Fast Transformer的助力下,实现了高精度模型自动训练的能力,并且可以根据客户的需求进行场景定制化,实现快速地算法迭代和升级。

使用效果及影响

通过NVIDIA的RIVA和NEMO平台,平安科技智能坐席系统实现了从传统模型到业界领先的端到端深度学习模型的转换,实现了基于容器化弹性伸缩技术的算法引擎部署,并且整合了系统中三个算法引擎技术,极大地提高了算法平台的训练效率和模型效果,帮助业务进行降本增效,促进了智能坐席系统在平安金融业务中的拓展和应用。

与此同时,平安也与NVIDIA针对前沿的ASR语音识别技术进行了深度的合作,并在顶级国际会议ICME上发表了学术论文《Cross-Language Transfer Learning and Domain Adaptation for End-to-End Automatic Speech Recognition》。论文就NVIDIA NEMO平台的QuartzNet语音识别模型,在跨领域、跨语言、跨口音地区等方面进行了大量地实验,和深入地分析。论文阐述的迁移学习观点和结论,进一步促进了平安科技智能坐席系统端到端语音识别模型的进化和演进。通过与NVIDIA的合作,平安继续在语音顶会SLT上发表了《Multi-QuartzNet: Multi-Resolution Convolution for Speech Recognition with Multi-Layer Feature Fusion》。高水平学术论文指导平安科技客服系统持续更新和升级,客服系统实际遇到的问题反过来促进学术论文的研究,形成了学术研究和生产服务系统互惠互赢的双向正循环。

“通过AI人工智能技术赋能传统金融保险业务是当下和未来主流的行业趋势,也是平安集团非常重要的战略发展目标。智能客服坐席项目是平安科技的重点科技项目之一,通过智能客服可以高精度地实现对于客服意图的智能匹配,更好地理解客服对产品的需求和意向。NVIDIA提供的RIVA和NEMO平台,解决了我们在AI算法落地过程中的痛点问题,高效灵活地训练和部署算法模型,实现了毫秒级的实时语音识别响应时间,97%的高精度保险业务场景意图识别率,以及自然流畅地人声合成语音。智能坐席系统只是平安科技迈向AI技术赋能业务的第一步,我们会将智能语音技术推广到语音质检、安全风控、用户画像等一系列业务场景中。通过AI技术和NVIDIA提供的技术平台,打造出更多的人工智能算法产品,提高平安金融业务的生产效率,为平安的客户提供更全面优质的产品体验。” 平安科技副总工程师王健宗博士表示。