NVIDIA 发布数字人微服务,为制作生成式 AI 数字化身铺平未来之路

NVIDIA ACE 现已全面在云端推出,并在 RTX AI PC 上提供抢先体验,已获戴尔科技、ServiceNow、Aww Inc.、英业达、完美世界游戏等多家客户服务、游戏和医疗保健领域的公司采用
作者 英伟达中国

COMPUTEX—2024年6月2日—NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服务,以加速新一代数字人的发展,并将在平台上推出全新的生成式AI突破。客户服务、游戏和医疗保健领域的公司率先采用ACE技术,以简化在客户服务、远程医疗、游戏和娱乐领域创建、动画化并操作栩栩如生的数字人的过程。

NVIDIA ACE 数字人生成式 AI 套件现已全面推出,包括以下内容:

  • NVIDIA Riva ASR,TTS 和 NMT — 用于自动语音识别、文本到语音转换和翻译。
  • NVIDIA Nemotron LLM — 用于语言理解以及根据上下文生成回复。
  • NVIDIA Audio2Face — 根据音轨制作栩栩如生的面部动画。
  • NVIDIA Omniverse RTX — 用于实时路径追踪以制作逼真的皮肤和毛发。

全新推出的技术包括:

  • NVIDIA Audio2Gesture — 用于根据音轨生成肢体手势,即将推出。
  • NVIDIA Nemotron-3 4.5B — 一种全新的小语言模型 (SLM),专为低延迟、本地端 RTX AI PC 推理而设计。

NVIDIA 创始人兼首席执行官黄仁勋表示:“数字人将为各行各业带来革命性变革。NVIDIA ACE 为我们的开发者生态提供多模态大语言模型和神经图形领域的突破,使我们更接近意图驱动的计算未来,即与计算机的交互将像与人类的互动一样自然。”

数字人进驻一亿台 RTX AI PC

NVIDIA 已将 ACE 作为 NIM 微服务提供给开发者在数据中心运行。现在,NVIDIA正在打造 ACE PC NIM 微服务,可以部署在装机量达到一亿台的 RTX AI PC 和笔记本电脑上。

这包括 NVIDIA 的首个小语言模型 (SLM) — NVIDIA Nemotron-3 4.5B,该模型专门用于在终端设备上运行,具有与在云端运行的大语言模型 (LLMs) 相似的精度和准确性。Nemotron-3 4.5B 小语言模型 (SLM) 现已进入抢先体验阶段。NVIDIA Audio2Face 和 NVIDIA Riva ASR 的设备端模型也将很快推出抢先体验版

全新的 NVIDIA AI Inference Manager (AIM) 应用开发工具包简化了 ACE 在 PC 上的部署过程。它以统一格式为 PC 预先配置必要的 AI 模型、引擎和依赖包,同时在 PC 和云端之间完美调度 AI 推理操作。
Inworld AI 合作开发的最新版 Covert Protocol 技术Demo 在 COMPUTEX 演示。通过在 GeForce RTX PC 上本地运行 Audio2Face 和 Riva ASR,该演示使玩家能够通过对话来互动,并影响数字人非玩家角色 (NPC) 的行为,以完成任务。

最新 ACE 技术扩展数字人生态规模

NVIDIA 正与 Aww Inc.、戴尔科技、Gumption、Hippocratic AI、英业达、掌趣科技、完美世界游戏、Reality Arts、甲尚科技、ServiceNow、Soulbotix、数字栩生和 UneeQ 等公司的开发者合作,利用 ACE 开发各种应用。

Aww Inc. — 位于日本的领先虚拟人技术开发公司 Aww Inc. 在 2018 年推出了首个虚拟名星 Imma。此后,Imma 在 50 多个国家成为主要全球品牌的代言人。现在,Aww Inc. 计划利用 ACE Audio2Face 微服务进行实时动画制作,为用户提供更好的互动交流体验。

完美世界游戏 — 游戏开发者和发行商完美世界游戏公司在其全新的神话荒野风格的 Legends 技术演示 Demo 中采用了 ACE。玩家可以与逼真的 AI NPC 用英语和普通话完全互动。利用 NVIDIA Audio2Face NIM,可实时生成与角色声音响应相符的逼真的面部动画。

掌趣科技 — 掌趣科技和悠米互娱联合推出的 Code Z 是一款 AI 游戏创作平台,能够利用 AI 技术减少创作开放世界游戏所需的资源,让个人和小型团队也能制作大型游戏。Code Z 基于“Faith Framework”AI 机器学习训练系统,让创作者无需编写任何代码,即可快速生成 3D 游戏场景和数字素材。此外,它还能让创作者创建和训练高度个性化的 AI 数字人,实现动态互动和沉浸式体验。Code Z 采用了 Audio2Face 和 DLSS,使 AI 数字人能够在与玩家实时对话时生成丰富的表情,并实现实时口型同步。

英业达 — 正在大力投资 AI 领域的科技公司英业达使用 NVIDIA Audio2Face NIM 增强其 VRSTATE 平台的医疗保健 AI 客户端。集成 NVIDIA Audio2Face NIM 可以提供更具吸引力和安抚性的虚拟咨询体验。英业达将在 COMPUTEX 期间展示一款可以帮助患者获取健康信息的 AI 客户端。

ServiceNow — 用于协助企业业务转型的 AI 平台 ServiceNow,近期在其 Now Assist Gen AI Experience 中展示 ACE NIM 的生成式 AI 服务客户端演示,突显数字化身在零售、旅游等行业提升客户和员工互动的潜力。
戴尔科技 — 在上个月的 Dell Technologies World 上推出用于制作数字助手的最新解决方案 Dell Generative AI Solutions。该解决方案使企业能够利用智能数字助理,通过自然对话的形式与零售、医疗保健和客户服务等各行各业的客户进行互动。

NVIDIA 在 COMPUTEX 2024 为数字人初创企业喝彩

NVIDIA 艺术团队使用基于 ACE 的生成式 AI 工具,包括 Synthesia 和 Hour One,制作了一个“digital Jensen”化身,该化身由文字生成的视频制作而成。这款多语言化身以他独特的声音和风格为特色,使用 ElevenLabs 的专有 AI 语音技术生成普通话和英语的声音。NVIDIA 还与专注于 AI 语音技术的 NVIDIA Inception 成员 Voicemod 合作,为 NVIDIA 创始人兼首席执行官黄仁勋主题演讲的谢幕曲进行创作。

ACE NIM 现已推出

用于服务器部署的 NVIDIA ACE NIM 微服务(包括 Riva 和 Audio2Face)现已投入生产,可添加 NVIDIA AI Enterprise 应用,供开发者获得企业级的支持服务。现可点击注册以获取在 RTX AI PC 上运行的 ACE NIM 微服务的抢先体验版。