循环智能: 利用GPU深度学习平台实现用机器研究对话的科学,让每次销售有更好的结果

by 英伟达中国

案例简介

循环智能(Recurrent AI)成立于2016年5月,致力于用机器研究对话的科学,并个性化教给每个销售,让每次销售有更好的结果。公司拥有来自清华大学、卡内基梅隆的顶尖科学家、工程师和经验丰富的解决方案专家组成的精英团队,曾效力于Google Brain、Facebook AI Research、微软亚洲研究院等全球顶级人工智能机构与IBM全球咨询服务部、Cisco等全球领先的企业服务公司。

创始人团队成员曾师从苹果公司现任AI负责人、深度学习奠基人之一Ruslan Salakhutdinov;亚马逊AWS现任AI负责人、机器学习泰斗Alex Smola;国家杰青、清华大学计算机系副系主任、数据挖掘顶级专家唐杰教授;曾从0到1打造国内知名的大数据分析公司,服务数百家企业,带领团队创造近亿元年营业额。

团队具备深厚的人工智能研发实力,曾获Nvidia先锋研究奖、Facebook ParlAI研究奖、北京市科学技术奖一等奖、吴文俊人工智能技术进步奖一等奖等;曾作为核心开发者研发了全球知名的科技大数据分析平台AMiner;过去三年在ICLR、NIPS、ICML、KDD、ACL等顶级AI会议发表论文二十余篇;在所有六个主流语言建模数据集保持世界第一名 (State-of-the-art)。

公司现在北京、上海、美国三地设有办公室,拥有100人以上规模自建AI标注团队,已获得来自金沙江创投等机构的数千万融资。

2018 GTC China大会期间,循环智能凭借在语音NLP领域的创新和对销售行为优化的贡献获得“NVIDIA 2018中国人工智能初创公司挑战赛”第4名的成绩。

循环智能联合创始人兼CEO陈麒聪先生表示:“沟通是人类社会的基础,循环智能致力于通过我们的技术和创新,帮助各领域最优秀的公司优化每一次销售沟通的过程,提升沟通效率,助力他们开拓更专业更高效的行业新阵地。英伟达提供的GPU人工智能计算解决方案使我们快速突破了语音语义模型的深度学习技术开发,相信基于NVIDIA 深度学习平台的助力,将会高质量改善现在销售市场混乱低效不合规的状况,大大提升企业的销售转化率,让消费者真正享受到更及时更有针对性的商品和服务,有效帮助企业提升客户体验。”

Case Introduction:

Recurrent.ai is a company offering AI conversation analytics service. We have an elite team of top scientists and engineers from Tsinghua University and CMU. Our team used to work in top AI research institutes in the world, including Google Brain, Facebook AI Research and Microsoft Research Asia. Now we have offices in Beijing, Shanghai and the United States and have a self-established AI annotation team of more than 100 members.

DealTape is the core product of Recurrent.ai. It records, transcribes, diarizes and analyzes each phone call to help businesses visualize problems in sales conversations and find best practices in real time. DealTape helps businesses cut labor cost and improve sales conversion.

DealTape has built all core AI technologies in-house. Utilizing the gigantic GPU memory and the outstanding acceleration performance of NVIDIA® Tesla® V100 GPU, DealTape has achieved fast training and inference of deep learning models used in speech recognition and natural language processing, shorten the iteration cycle of our product and made breakthroughs in developing core features of our product.

背景

金融、教育和B2B等行业有大量公司会购买呼叫系统,他们对监督坐席与客户沟通的过程有着强需求,然而过去囿于技术,大部分录音只能靠人工重听或者弃置,没有利用它获得任何价值。

在消费结构进一步优化的当下,销售话术执行差、客单流失大、成单率低、销售客服新员工培训成本高等问题已经成为很多企业关注的重点。电话录音可追溯而不可作假的特性,让呼叫系统成为了一个不可篡改的精准用户画像来源。同时坐席与客户的全部沟通过程也完整保留在电话录音中,这意味着影响成单率的全部因素都在录音之中,只要能准确地把它们提取出来,就能有效提高企业的价值。

挑战

现行的语音识别在企业专业领域的运用面临的困难主要在三方面:(1)算力问题。语音识别的计算资源低效,导致识别速度慢,延迟长,信息总是滞后;(2)算法问题。现行通用的语音识别引擎识别专业领域电话录音的正确率低,效果差,丢掉很多关键信息,不足以支撑上层的语义处理任务;(3)上层NLP和数据分析挖掘技术问题。语音识别的结果离商业价值中间仍隔了大量复杂技术环节,技术完成商业变现的周期非常长,人力成本很高。

解决方案及其成效

循环智能核心产品交易磁带(DealTape)智能呼叫系统,拥有自主知识产权的核心技术栈,利用NVIDIA® Tesla® V100 GPU的超大显存和非凡性能,实现了语音识别与语义分析模型的快速训练和推断。

循环智能最早使用游戏级显卡来进行训练,而NVIDIA® Tesla® V100 GPU的高性能可使用原来两倍线程数量从内存读取数据进行计算,将每个Batch的计算时间缩短到原来的一半,同时NVIDIA® Tesla® V100 GPU的高显存可以将Batch Size提升到原来的400%,将深度学习模型的训练周期从一周缩短到一两天,并且将深度模型的参数数量提升100%,显著提升了模型准确率。

在NVIDIA GPU强大的算力助力下,交易磁带(DealTape)突破了语音识别、说话人分离、话术执行质检、自动客户画像、话术推荐、话术提炼等核心功能的自研。

图1:AI自动挖掘的成单相关「话术点」

(1)语音识别定制

通用引擎对企业专有名词的识别率较差。语音识别定制需要经过一个基线模型的积累,在这之后,数据就可以先让基线模型进行预识别,即使CER有三十多或者四十多,但是大部分字还是正确的,标注员可以对它进行标注,这样成本就大大降低了。交易磁带(DealTape)最新的基线模型是已经用了10000小时左右的标注数据进行训练的结果,对于已有积累的相关行业,标注的目的只是适配一下数据特点,只需要进行「轻标注」,标注量仅为全标注的十分之一,最大程度缩短测试周期,为企业节省大量时间成本及相应维护的人力成本。

(2)话术分析与挖掘

拥有很多服务人员的大型企业都有非常标准的话术模版,通常来自于咨询公司或内部业务专家。但这些话术跟成单的真正关系难以得到验证。一方面,交易磁带(DealTape)基于上下文的语义抽取技术能高精度的检测服务人员对话术的执行情况。另一方面,与其它解决方案不同的是,DealTape可以将话术跟成单的关系这样的actionable insight完全解码可视化给各级管理者,辅助销售业绩的增长。对大多数完全没有模版的企业来说,DealTape基于深度学习的话术提炼黑科技可以直接根据销售目标提炼出最有影响力的模版和流程,比专家更加全面与客观。

(3)语言模型的突破支撑垂直行业高精度语音识别,话术质检和话术提炼

语言建模是影响语音识别和话术挖掘效果的核心因素,循环智能在语言建模这一NLP核心任务上取得了一系列突破,包括Highrank语言模型和Transformer-XL模型,在所有六个主流语言建模数据集上取得了世界第一(state-of-the-art)的结果,这也是历史上首次有团队在这六个数据集上同时取得世界第一的结果。

其中,Highrank语言模型指出了当前主流语言模型存在的表达能力根本缺陷,并提出了混合Softmax的方法解决了这一问题。Transformer-XL模型极大地提升了对超长序列进行建模的能力,其有效建模长度相比于传统RNN和标准Transformer分别提升80%和450%,并且将Transformer模型在测试阶段的速度提升了超过1800倍。有了这样高效准确的建模能力,DealTape能够快速为每个客户交付客户专属的高精度语音识别和话术挖掘模型。

图2:保险行业的「保险责任 1」标签对应的语句样例

影响

交易磁带(DealTape)智能呼叫系统采用了NVIDIA® Tesla® V100 GPU的深度学习平台,每个客户的深度学习语音语义模型的训练时间从一周缩短到一到两天,且可以运行模型的参数数量提升了100%从而显著提升了模型准确率。这一改进有效的赋能垂直行业的深度语音NLP应用,相比传统基于底层ASR的应用,大幅节省了垂直行业的语音NLP重复开发成本,让企业将更多精力应用于跟自身业务应用更结合的技术开发和迭代,而非在底层ASR和NLP理解上的开发,缩短了企业将AI在销售上转化为价值的宝贵时间。交易磁带不断自主挖掘不同的商业背景下,各类话术的积极与消极影响,让坐席和管理者都能够节省90%以上听录音的时间,直接发现沟通中的问题,进行有针对性的优化,有效提升企业转化率,同时为减少客诉,提升客户体验起到了有力保障。

作为一个高效的服务分析系统,交易磁带可以很好地与企业销售与服务团队的管理结合,开辟智能商业新领域,加速人机协同,共同进化。

www.nvidia.com

© 2019 NVIDIA Corporation. All rights reserved.

h2{ color: #76B900; }