大翻转:加速计算如何重塑科学系统——以及未来走向

作者 Dion Harris

过去,计算能力从庞大的超级计算机逐渐延伸到我们口袋里的芯片。

过去十五年间,创新的轨迹已然转向:源自游戏领域、通过加速计算实现扩展的 GPU 技术,正逆流而上重塑超级计算格局,并将 AI 革命推向科学计算领域最尖端的系统。

位于于利希研究中心的 JUPITER 超级计算机,正是这个新时代的象征。

它不仅位列全球效率最高超级计算机 (每瓦特性能达 63.3 Gigaflops),更是强大的 AI 引擎,其 AI 算力达到 116 Exaflops,较 ISC 2025 展示的 92 Exaflops 有了显著提升。

这就是“翻转”的实例。2019 年,全球最强高性能计算系统 TOP100 榜单中近 70% 仅使用 CPU 。如今这一比例已骤降至 15% 以下,TOP100 中有 88 个系统采用了加速计算——其中 80% 由 NVIDIA GPU 驱动。

在范围更大的 TOP500 榜单中,388 个系统 (占比 78%) 采用了 NVIDIA 技术,其中包括 218 个 GPU 加速系统 (与去年同期相比增加 34 个) 以及 362 个通过高性能 NVIDIA 网络互连的系统。趋势是显而易见的:加速计算已成为行业标准。

但真正的变革在于 AI 性能的飞跃。借助 NVIDIA Hopper 和 Blackwell 等架构以及 JUPITER 等系统,研究人员如今能够使用的 AI 算力较以往实现了数量级的增长。

AI FLOPS 已成为新的标尺,使气候建模、药物研发和量子模拟等领域得以突破——这些领域既需要大规模计算能力,又要求高效运算性能。

早在 SC16 大会上,在当今生成式 AI 浪潮兴起之前,NVIDIA 创始人兼首席执行官黄仁勋就预见了未来趋势。他预言 AI 将很快重塑全球最强大的计算系统。

黄仁勋表示:“几年前,深度学习如雷神之锤般横空出世,为我们提供了解决世界上最棘手难题的强大工具。”

在 SC16 大会上,黄仁勋阐述了 AI 将如何重塑全球最强大的科学计算系统。

计算功耗背后的数学原理早已表明,转向 GPU 是大势所趋。

但正是由基于这些 GPU 打造的 NVIDIA CUDA-X 计算平台所点燃的 AI 革命,才极大拓展了这些计算机的能力。

突然间,超级计算机不仅能在双精度 (FP64) 下还能在混合精度 (FP32 和 FP16) 乃至 INT8 等超高效率数据格式下实现更有意义的科学计算——这些正是现代 AI 的基石。

这种灵活性使研究人员能够将功耗预算推向前所未有的极限,从而运行更大、更复杂的模拟,并训练更深层的神经网络,同时最大限度地提高每瓦特性能。

但即使在 AI 尚未普及之前,硬性指标数据早已凸显了问题的紧迫性——功耗预算没有讨价还价的余地。无论是 NVIDIA 内部还是整个行业的超级计算机研究人员都在努力解决摆在眼前的问题,而这条路就是用 GPU 铺就的。

要在不产生胡佛水坝规模电费账单的情况下实现 Exascale 级计算,研究人员需要加速技术。GPU 每瓦特功耗的运算效率远超 CPU,这一能效优势在 AI 时代之前已显露端倪。因此当 AI 浪潮来临时,大规模 GPU 系统已经形成势头。

2012 年,在橡树岭国家实验室,Titan 系统就播下了种子。作为美国首批将 CPU 与 GPU 以史无前例的规模进行配对的大型系统之一,它展示了并行计算能够释放巨大的应用潜力。

2013 年在欧洲,Piz Daint 系统在性能与能效方面树立了新标杆,并在关键领域如用于天气预报的 COSMO 模型等实际应用中验证了其卓越价值。

到 2017 年,这一转折已势不可挡。橡树岭国家实验室的 Summit 和劳伦斯利弗莫尔实验室的 Sierra 为顶级系统树立了新标杆:加速优先。它们不仅运行速度更快,更让气候建模、基因组学、材料科学等科学领域能探索从前无法触及的复杂问题。

这些系统能够以更少的资源实现更强大的功能。在 Green500 全球最节能超级计算机榜单上,前八名均采用 NVIDIA 加速技术,前十名中有七台系统通过 NVIDIA Quantum InfiniBand 互连。

但这些亮眼数字背后的故事是 AI 能力已成为衡量标准。JUPITER 系统可在提供 116 Exaflops AI 算力的同时,还能达到 1 Exaflop FP64 性能,这清晰地表明科学领域如今正将模拟与 AI 相融合。

能效提升不仅使 Exascale 级计算成为可能,更让 Exascale 级 AI 成为现实。当科学研究获得大规模 AI 支持后,发展曲线将会急剧上升。

下一步发展

这不仅仅是基准测试的问题,更是关于真正的科学:

  • 更快速、更精准的天气与气候模型
  • 药物研发与基因组学领域的突破性进展
  • 核聚变反应堆与量子系统的模拟研究
  • AI 驱动的跨学科研究新前沿

这一转变起初是出于能效的迫切需求,后来演变为架构优势,如今已经成熟为科学超级力量:模拟与 AI 的结合,正以前所未有的规模蓬勃发展。

一切始于科学计算。如今,其余计算领域也将随之发展。