NVIDIA全新的Grace CPU打造世界上性能最强AI 超级计算机

作者 英伟达中国

瑞士国家超级计算中心的 Alps系统将推动各领域实现突破性研究

NVIDIA 全新的 Grace CPU 将为世界上性能最强 AI 超级计算机提供动力。

瑞士国家超级计算中心 (CSCS) 的新系统将使用 Grace 推动各领域实现突破性研究,Grace 是 NVIDIA 今天推出的基于 Arm 架构的革命性数据中心 CPU。

从气候和天气到材料科学、天体物理学、计算流体动力学、生命科学、分子动力学、量子化学和粒子物理学,以及经济学和社会科学等多个领域,Alps 系统将在推动整个欧洲和全世界的科学发展方面发挥关键作用。该系统将于 2023 年上线。

NVIDIA 创始人兼首席执行官黄仁勋在 NVIDIA GTC主题演讲中表示:“我们非常激动地宣布,瑞士国家超级计算中心将建造一台搭载 Grace CPU 和我们的下一代 GPU 的超级计算机。”

Alps 将由慧与(Hewlett-Packard Enterprise) 建造,采用新的 HPE Cray EX 超级计算机产品线以及 NVIDIA HGX 超级计算平台。该平台除了全新的Grace CPU,还包括 NVIDIA GPU 和 NVIDIA HPC SDK 。

Alps 系统将取代 CSCS 现有的 Piz Daint 超级计算机。

AI 新型超级计算

Alps 是新一代超级计算机中的一员。新一代超级计算机利用 GPU 加速的深度学习技术,将超级计算扩展到传统的建模和模拟领域之外。

CSCS 主管 Thomas Schulthess 表示:“深度学习只是我们添加到工具箱中的一组功能非常强大的工具而已。”

Alps 利用 NVIDIA CPU 和 GPU 之间的紧密耦合,预计仅需两天就能训练出全球最大的自然语言处理模型 GPT-3,比 NVIDIA 的 2.8-AI exaflops Selene 超级计算机快 7 倍。Selene 超级计算机目前被 MLPerf 认定为世界领先的 AI 超级计算机。

CSCS 用户能够将这种超强的 AI 性能广泛地应用到从自然语言理解中获益的新兴科学研究。

例如,这包括分析和理解科学论文中提供的海量知识,以及生成用于药物发现的新分子。

新机之魂

基于数十亿部智能手机和其他边缘计算设备所采用的超高效 Arm 微架构,Grace可以在十分复杂的 AI 和高性能计算工作负载上提供 10 倍于当今速度最快的服务器的性能。

Grace 将支持 NVIDIA 的新一代一致性 NVLink 互连技术,使数据可以在系统内存、CPU 和 GPU 之间更快速地移动。

此外,由于 GPU 对数据科学加速的支持力度越来越大,Alps 还将能够以更大的规模加速其用户的工作流程,例如获取现代超级计算所需的大量数据。

Schulthess 表示:“科学家不仅能够进行模拟,还能对数据进行预处理或后处理。这样可以使他们的整个工作流程更高效。”

从粒子物理学到天气预报

长期以来,CSCS 一直在支持科学家探索前沿科学(特别是材料科学、天气预报和气候建模)和分析从新一代科学仪器获取的数据流。

CSCS 为瑞士气象局 MeteoSwiss 设计并运行了一个数值化天气预报专用系统(NWP)。该系统从 2016 年开始在 GPU 上运行。

这种在 GPU 上运行 NWP 的长期经验也是未来气候模拟的关键因素——不仅在长期气候变化建模方面发挥着关键作用,而且还有助于构建能够更准确地预测极端天气事件的模型,从而挽救生命。

该团队的一个目标是运行空间分辨率为 1 公里、可以绘制雷雨云等对流云的全球气候模型。

瑞士科学家们还使用 CSCS 超级计算机,对欧洲核子研究委员会 CERN 的大型强子对撞机 (LHC) 提供的数据进行分析。CSCS超级计算机是世界 LHC 计算网格中位于瑞士的第 2 级系统。

LHC 位于日内瓦,耗资 90 亿美元,是有史以来最昂贵的科学仪器之一,每年可产生 90 PB 的数据。

Alps 使用新的软件定义基础设施,可以支持各种项目。

因此,将来,诸如 MeteoSwiss 这样不同的团队就可以在一个统一的基础设施上使用一个或多个分区,而不必再使用不同的机器。
这些可以是针对单个用户的虚拟临时集群,也可以是预定义的集群,不同的研究团队可以将这些集群在CSCS 统一的基础设施上运行,并自行操作。