在 TOP500 榜单中,由 NVIDIA GPU 加速的超级计算机创纪录地达到 136 台

作者 Rick Merritt

NVIDIA GPU 为领先的系统提供强大性能,助力实现首批百万兆级科学应用。

最新的全球速度最快的系统 TOP500 榜单显示,新一轮的超级计算机主要由 GPU 加速。

在这个备受关注的榜单中,102 台新入榜的超级计算机中有 42 台使用了 NVIDIA GPU 加速器,包括本周发布的强大“新秀”AiMOS。排在第24 位的 AiMOS 在高性能 Linpack 基准测试(超级计算性能的标准)中,实现了 8 千万亿次浮点运算的计算性能。

该系统安装在纽约仁斯利尔理工大学,由 NVIDIA V100 Tensor Core GPU 提供支持,就像位于橡树岭国家实验室的迄今为止世界上速度最快的超级计算机 Summit 一样。在最新的 TOP500 榜单中,136 个系统由 NVIDIA GPU 驱动,包括前十名的一半。

欧洲和日本最快的超级计算机以及世界上最快的工业超级计算机均由 NVIDIA GPU 加速。

TOP500 榜单中将近 40% 的总计算能力(626 千万亿次浮点运算)来自 GPU 加速系统。在十年前,该榜单上没有任何加速的超级计算机。

TOP500 超级计算机中有三台是 NVIDIA 自有系统,包括在最新榜单中排名第 20 位的 DGX SuperPOD。这些系统用于全天候处理计算密集型 AI 工作负载,例如自动驾驶汽车开发

本周的 SC19 上发布了 Green500 榜单,在前 30 名超级计算机中,90% 都由 NVIDIA GPU 驱动。

世界各地的大学和实验室纷纷使用 NVIDIA GPU 加速的超级计算机来实现突破性的研究。NVIDIA 的全堆栈优化方法确保了开发人员和研究人员能够在其应用程序中从这种强大的计算能力中受益,从而推动科学的发展,并完成他们毕生的工作。

Summit 超级计算机配备了超过 27000 个 NVIDIA V100 Tensor Core GPU,助力实现首批百万兆级科学应用,包括:

  • 基因组学:2017 年,超过 5 万美国人的死亡与阿片类药物成瘾有关。为了更好地理解和应对阿片类流行病,橡树岭国家实验室的研究人员正在研究导致慢性疼痛和成瘾等复杂特征的遗传变异。使用 Summit 和混合精度技术,该团队每秒可处理 300 万亿次元素比较,其峰值吞吐量可达到每秒 2.31 百亿亿次计算,这是迄今为止最快的科学应用。
  • 气象学:极端天气活动呈上升趋势,部分原因是人为造成的气候变化。劳伦斯伯克利国家实验室的科学家正致力于使用 AI 更准确地预测极端天气模式的路径。这个荣获戈登贝尔奖的团队使用 Summit 训练其神经网络,创造了最快深度学习算法的性能记录,达到了每秒 1.13 百亿亿次浮点运算。
  • 病理学:到 2025 年,全世界每年新发癌症病例将达到 2150 万,这对医生分析活检扫描提出了巨大需求。石溪大学开发了软件堆栈 MENNDL 来生成 AI 模型,该模型能够以相当高的精度分析病理数据,与调优后的 InceptionNet 模型相比,推理速度快 16 倍。这将使实时处理活检扫描生成的 10 亿级像素分辨率图像成为可能。利用 Summit,研究人员实现了每秒 1.3 百亿亿次浮点运算的性能,以生成其神经网络。
  • 核废物补救措施:汉福德核电站位于华盛顿州,占地 580 平方英里,在 1943 年至 1989 年期间用于生产核武器和核反应堆用钚。关闭后,超过 100 平方英里的地下水遭到污染。为了帮助完成清理工作,劳伦斯伯克利国家实验室、太平洋西北国家实验室、布朗大学和 NVIDIA 的研究人员开发了物理信息生成式对抗网络来量化地下水流。该应用程序在 Summit 上实现了每秒 1.2 百亿亿次浮点运算的峰值和持续性能。