NVIDIA 众多具有里程碑意义的创新(驱动 AI、加速计算、实时光线追踪以及无缝连接数据中心提供支持的基础性技术),其根源都可以追溯其研究机构——NVIDIA Research 。这个团队由全球约 400 名专家组成,其研究领域包括计算机架构、生成式 AI、图形和机器人等。
NVIDIA Research 成立于 2006 年,自 2009 年起由斯坦福大学计算机科学系前系主任 Bill Dally 领导。在企业设立的研究机构中,NVIDIA Research 独树一帜,其使命是攻克复杂的技术难题的同时对公司和世界产生深远影响。
NVIDIA Research 首席科学家兼高级副总裁 Dally 表示:“在开展卓越研究的同时我们努力确保研究工作与公司业务紧密相关。只做到其中一点很容易,两者兼顾则颇具挑战。”
在 NVIDIA GTC 大会上,Dally 和 NVIDIA Research 的团队领导们分享了该团队的创新成果。NVIDIA GTC 是 AI 领域的顶尖开发者大会,本周在美国加州圣何塞举行。
在描述使命时,许多研究机构会表示其研究项目的时间跨度比产品团队的项目更长,但 NVIDIA 研究人员寻求的是具有更大“风险跨度”的项目。一旦成功,这些项目便有可能获得巨大回报。
“在开展卓越研究的同时,我们努力确保研究工作与公司业务紧密相关。”—— NVIDIA Research 首席科学家兼高级副总裁 Bill Dally
图形研究副总裁、NVIDIA 首位研究员 David Luebke 表示:“我们的使命是做对公司有益的事。这不是为了打造一个陈列最佳论文奖的荣誉室或为了建立研究人员名人堂。我们是一小群人,有幸能够研究可能失败的想法。因此,我们有责任不浪费机会,在那些一旦成功就能产生重大影响的项目上全力以赴。”
作为一个团队进行创新
NVIDIA 的核心价值观之一是“one team”,这体现了对协作的高度重视,有助于研究人员与产品团队和业内相关人士紧密合作,将他们的想法转化为对现实世界的影响。
NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 表示:“NVIDIA 的每个人都积极寻求合作,因为 NVIDIA 所做的加速计算工作需要进行全栈优化。如果每项技术都孤立存在,每个人都各自为政,就无法实现这一目标。大家必须作为一个团队齐心协力,才能实现加速。”
在评估潜在项目时,NVIDIA 的研究人员会考虑其更适合研究团队还是产品团队、相关工作是否值得在顶级会议上发表,以及对整个公司是否有明显的潜在益处。如果决定推进该项目,就会与关键利益相关者进行合作。
“我们是一小群人,有幸能够研究可能失败的想法。因此,我们有责任不浪费机会。”—— 图形研究副总裁 David Luebke
Catanzaro 表示:“我们与他人合作,将想法变为现实。我们在这个过程中常常发现,在实验室里看似很棒的想法在现实世界中并非一定有效。在这种紧密的合作中,研究团队需要保持谦逊,向公司其它部门学习,了解如何才能让自己的想法变成现实。”
通过论文、技术会议以及 GitHub 和 Hugging Face 等开源平台,该团队分享了大量成果。但他们的重点始终放在对行业的影响上。
Luebke 表示:“我们认为,发表论文是我们工作的一个重要附带成果,但这并非我们的核心目的。”
NVIDIA Research 的首个工作重点是光线追踪,经过十年的持续努力,最终直接催生了 NVIDIA RTX, 这一发布重新定义了实时计算机图形。如今,NVIDIA Research 包含多个专业团队,涉及芯片设计、网络、编程系统、LLM、基于物理学的模拟、气候科学、人形机器人和自动驾驶汽车等领域,并且还在不断拓展研究领域并吸纳全球专业人才。
改变 NVIDIA 与整个行业
NVIDIA Research 不仅为公司一些最知名的产品奠定了基础,其创新成果还推动并开启了如今的 AI 和加速计算时代。
“大家必须作为一个团队齐心协力,才能实现加速。”——应用深度学习研究副总裁 Bryan Catanzaro
这一切始于 2006 年推出的 CUDA,它是一个并行计算软件平台和编程模型,使研究人员能够利用 GPU 加速多种应用。通过 CUDA,开发者可以轻松地利用 GPU 的并行处理能力,从而加快科学模拟、游戏软件以及 AI 模型创建的速度。
Luebke 表示:“对于 NVIDIA 而言,开发 CUDA 是最具革命性的一件事。这发生在我们成立正式研究团队之前,最终大获成功是因为我们聘请了顶尖的研究人员,并让他们与顶尖架构师合作。”
让光线追踪成为现实
NVIDIA Research 成立后,其研究人员便开始致力于研究 GPU 加速的光线追踪技术,花费数年时间开发了相关算法和硬件,最终实现了这项技术。2009年,该项目由已故的实时光线追踪先驱、NVIDIA 专业图形副总裁 Steven Parker 领导,随着 NVIDIA OptiX 应用框架进入产品阶段,并在 2010 年的 SIGGRAPH 论文中进行了详细介绍。
研究人员的工作不断拓展,通过与 NVIDIA 架构团队合作,最终成功地开发了 NVIDIA RTX 光线追踪技术,其中包括为游戏玩家和专业创作者实现实时光线追踪的 RT Core。
2018 年推出的 NVIDIA RTX 还标志着 NVIDIA Research 另一项创新成果的诞生:NVIDIA DLSS(深度学习超级采样)。借助 DLSS 技术,图形渲染工作流不再需要绘制视频中的所有像素。相反,只需绘制一小部分像素,然后由 AI 工作流根据这些信息生成清晰的高分辨率图像。
为几乎所有应用加速 AI
在 AI 软件领域,NVIDIA 研究人员的贡献始于面向 GPU 加速神经网络的 NVIDIA cuDNN 库。它是在深度学习尚处于起步阶段时作为研究项目开发出来的,于 2014 年作为产品发布。
随着深度学习迅速普及并发展出生成式 AI,NVIDIA Research 始终站在最前沿。NVIDIA StyleGAN 便是一个典型例子,这是一个开创性的视觉生成式 AI 模型,展示了神经网络如何快速地生成逼真的图像。
虽然生成对抗网络(GAN)已于 2014 年首次提出,但“StyleGAN 是第一个生成的图像能够符合照片视觉效果完全以假乱真的模型。这是一个具有分水岭意义的重大时刻,”Luebke 说道。

NVIDIA 的研究人员推出了一系列广受欢迎的 GAN 模型,例如 AI 绘画工具 GauGAN,它后来发展成为 NVIDIA Canvas 应用程序。随着扩散模型、神经辐射场和高斯溅射技术的兴起,他们仍在推进视觉生成式 AI 的发展,包括最近推出的 3D 模型 Edify 3D 和 3DGUT。

在 LLM 领域,Megatron-LM 是一项应用研究计划,它能够高效地训练和推理大规模语言模型,用于内容生成、翻译和对话式 AI 等语言类任务。它已经被集成到用于开发定制生成式 AI 的 NVIDIA NeMo 平台中,该平台还包含起源于 NVIDIA Research的语音识别和语音合成模型。
在芯片设计、网络、量子等领域不断取得突破
AI 和图形只是 NVIDIA Research 涉足的部分领域,其多个团队在芯片架构、电子设计自动化、编程系统、量子计算等领域也取得了诸多突破。
2012 年,Dally 提交了一份研究提案,该项目后来发展出了 NVIDIA NVLink 和 NVSwitch。这是一种高速互连技术,能够在加速计算系统中实现 GPU 和 CPU 处理器之间的快速通信。

2013 年,电路研究团队发表了关于芯片间链路的研究成果,其中引入了一种与该互连技术联合设计的信令系统,实现了裸片之间的高速、小面积、低功耗连接。该项目最终成为了 NVIDIA Grace CPU 和 NVIDIA Hopper GPU 之间的连接技术。
2021 年,ASIC 和 VLSI 研究小组开发了一种名为 VS-Quant 的 AI 加速器软硬件协同设计技术,使许多机器学习模型能够以 4 位权重和 4 位激活精度高效地运行。他们的工作影响了 NVIDIA Blackwell 架构中 FP4 精度支持的开发。
今年 CES 上发布的 NVIDIA Cosmos 平台也是 NVIDIA Research 开发的,旨在加速开发面向新一代机器人和自动驾驶汽车的物理 AI。详细信息,请阅读相关研究论文并收听关于Cosmos 的 AI 播客节目。
欢迎在 GTC 大会上了解关于 NVIDIA Research 的更多信息。