在翻译中发现含义:推理领域的突破助力科大讯飞语音应用程序

by 英伟达中国

至少从最初的“星际迷航 (Star Trek)”系列播出后开始,人们就梦想拥有一个口袋大小的即时翻译设备。而人们对找到办法辨别医生字迹的渴望甚至比这更早。

得益于深度学习推理的进步,科大讯飞这家中国最大的科技公司之一已经对这两个问题提出了切实可行的解决方案。在推理方面,受过训练的神经网络可以完成其学会的所有任务。

和我对话

顾名思义,科大讯飞便携式翻译机是一种能将听到的语音翻译成另一种语言的紧凑型手持设备。

得益于 NVIDIA Tesla P4/P40 训练和推理加速器以及科大讯飞的高级翻译算法,这个与遥控器大小相仿的 GPU 加速设备可以实时翻译中文、英语和维吾尔语。

中国最大的语音技术提供商科大讯飞的云计算研究院副院长张致江说:“它就像一个装在口袋里的专业翻译,随时随地帮您突破语言障碍。”

推理效率提升 15 倍

张致江说,通过使用 Tesla P4 和 P40 GPU 加速器,科大讯飞语音云平台的语音识别正确率已达到 97%,并且其推理效率比使用 CPU 所能达到的推理效率提升了 15 倍。该公司预计这些突破会带来新的业务应用场景和业务模式。

科大讯飞表示,该便携式翻译机自三月份发布以来已经销往 97 个国家/地区,提供了超过两百万次的服务。

使用 AI 的智能医疗服务

科大讯飞并不局限于在翻译方面做出努力。位于合肥的该公司和中国的多家医院以及医疗机构合作,将其语音识别专业技术与 AI 结合起来,为医生和患者提供更加智能的医疗服务。

人们不用再费劲地阅读医生的手写说明或处方了。取而代之的是,医生可以直接口述信息,而科大讯飞的技术能自动将录音转换成电子医疗记录。

Close up of a male doctor filling out a medical prescription
科大讯飞语音云可以将医生的潦草字迹转换成可读文字。

该公司表示,部署在 Tesla P4 加速的科大讯飞语音云上的智能听写功能可以过滤掉不需要的信息,以快速将医疗数据转换为文字。该公司表示其中文语音转文字的正确率是 97%。

通过使用讯飞语音云平台来处理云中的海量数据,科大讯飞已经推出了多项智能语音服务,包括讯飞口讯、讯飞语音触摸和灵犀语音助手。讯飞语音云平台拥有超过 15 亿的用户,日服务量达到 40 亿次。

张致江说:“随着讯飞语音云不断升级并扩大应用范围,NVIDIA 深度学习 GPU 平台为科大讯飞增添技术动力,并使用户能立即从尖端技术中受益和享受到更好的用户体验。”

要想了解有关科大讯飞的更多信息,请参加 3 月 26 日至 29 日在硅谷举办的 GPU 技术大会科大讯飞医疗 CEO 陶晓东将谈论该公司如何利用其 AI 和语音识别技术研究成果为医生提供帮助。立即报名