正如在超级计算专家齐聚的年度盛会 ISC 上所展示的,加速计算正在帮助研究者努力应对当今的重大挑战。
研究者们致力于构建模拟新能源的数字孪生,或者通过使用人工智能(AI)和高性能计算(HPC)深入探索人类的大脑。
NVIDIA 加速计算业务副总裁 Ian Buck 在汉堡举行的 ISC 上发表了特别演讲。他在演讲中表示,其他公司正在使用高敏感度仪器将 HPC 推向边缘或在混合量子系统上加速模拟。
实现超过 10 Exaflops 的 AI 性能
例如洛斯阿拉莫斯国家实验室 (LANL) 的一台名为 Venado 的新型超级计算机将提供 10 exaflops 的 AI 性能,以推动材料科学和可再生能源等领域的研究工作。
LANL 的研究者使用该系统中的 NVIDIA GPU、CPU 和 DPU,将其多物理场计算应用的速度提高了 30 倍。该系统以新墨西哥州北部的一座山峰命名。
Venado 使用 NVIDIA Grace Hopper超级芯片,将工作负载的运行速度较之前的 GPU 提升了 3 倍。这台超级计算机还配备 NVIDIA Grace CPU 超级芯片,在长尾未加速应用上的每瓦性能是传统 CPU 的两倍。
BlueField 蓄势待发
LANL 系统是全球众多采用 NVIDIA BlueField DPU 的最新系统之一,该系统用于卸载和加速主机 CPU 的通信和存储任务。
此外,德克萨斯州高级计算中心也正在为 Lonestar6 上的 NVIDIA Quantum InfiniBand 网络添加 BlueField-2 DPU。该网络将成为一个云原生超级计算开发平台,能够以裸机性能托管多个用户和应用,同时安全地隔离工作负载。
Buck 表示:“这是下一代超级计算和HPC云的首选架构。”
欧洲的百亿亿次级超级计算机
在欧洲,NVIDIA 和 SiPearl 正在一起扩大在 Arm 上构建百亿亿次级计算的开发者生态系统。这项工作将帮助该地区的用户将应用移植到使用 SiPearl 的 Rhea 和未来基于 Arm 的 CPU 以及 NVIDIA 加速计算和网络技术的系统上。
日本筑波大学的计算科学中心正在 NVIDIA Quantum-2 InfiniBand 平台上将 NVIDIA H100 Tensor Core GPU 和 x86 CPU 搭配使用。这台新的超级计算机将处理气候学、天体物理学、大数据、AI等方面的工作。
这些新系统将加入最新全球超级计算机排行榜 TOP500,该榜单上 71% 的超级计算机采用 NVIDIA 技术。此外,榜单上 80% 的新系统还使用 NVIDIA GPU 和/或网络,并且 NVIDIA 的网络平台是 TOP500 系统使用最多的互连平台。
HPC 用户采用 NVIDIA 技术,是因为它们能够为超级计算工作负载——模拟、机器学习、实时边缘处理,以及量子模拟和数字孪生等新兴工作负载提供强劲的应用性能。
Omniverse 大幅推动科学研究的发展
为了展示这些系统的功能,Buck 播放了英国原子能管理局和曼彻斯特大学的研究者在 NVIDIA Omniverse 中构建的虚拟核聚变发电站演示。这个数字孪生实时模拟了整座发电站、其机器人组件,甚至发电站的核心——核聚变等离子体的行为。
三维设计协作世界模拟平台 NVIDIA Omniverse 使该项目中的远程研究者可以使用不同的三维应用开展实时合作。他们将通过用于创建物理学AI模型的框架——NVIDIA Modulus 来改进他们的工作。
Buck 表示:“这项工作的复杂程度令人难以置信,但它正在为未来的清洁可再生能源打下基础。”
AI 在医学影像领域的应用
另外,Buck 描述了研究者如何在 NVIDIA Cambridge-1 上创建一个由 10 万张人脑合成图像组成的图像库。这台超级计算机专门用于通过 AI 推动医疗行业的发展。
一支来自伦敦国王学院的团队使用 MONAI(一种用于医学影像的 AI 框架)生成了栩栩如生的图像,这些图像可以帮助研究者了解帕金森病等疾病的发展过程。
Buck 表示:“这充分表明了 HPC 与 AI 这对组合正在为科学和研究界做出真正的贡献。”
边缘 HPC
HPC 工作越来越多地延伸到超级计算机中心之外的范畴。观测站、卫星和新型实验室仪器需要实现数据的实时流式传输和可视化。
例如,劳伦斯伯克利国家实验室的光片显微镜工作团队正在使用 NVIDIA Clara Holoscan 实时观察纳米级的生命,这项工作在 CPU 上需要花费数天时间。
为了将超级计算带到边缘,NVIDIA 正在开发用于 HPC 的 Holoscan。Holoscan 是我们图像软件的一个高度可扩展版本,它可以加速各种科学研究工作。该软件将在 Jetson AGX 模块和设备、四路 A100 服务器等各种加速平台上运行。
Buck 表示:“我们也期待研究者们通过该软件展开工作。”
加快量子模拟的速度
Buck 表示另一个超级计算载体——NVIDIA cuQuantum 正在被迅速采用。这个软件开发工具包可以加快 GPU 上的量子电路模拟速度。
数十家企业机构已将它用于多个领域的研究。该工具包被集成到主要的量子软件框架中,因此用户无需进行额外的编码就可以实现 GPU 加速。
AWS 最近宣布在其 Braket 服务中提供 cuQuantum。该公司展示了 cuQuantum 如何在量子机器学习工作负载上提供高达 900 倍的加速,同时减少 3.5 倍的成本。
Buck 表示:“量子计算具有巨大的潜力。为了离有价值的量子计算更近一步,我们必须在 GPU 超级计算机上模拟量子计算机。我们十分高兴能站在这项工作的最前沿。”