在全球最大的超级计算机之一上运行的应用表明,NVIDIA GPU在能效方面处于领先地位。
人们一致认为:加速计算就是高能效计算。
作为美国能源部面向开放科学的主要设施,美国国家能源研究科学计算中心(NERSC)测量了其四个关键高性能计算和AI应用上的结果。
他们记录了这些应用程序的运行速度,以及在Perlmutter上仅CPU节点和GPU加速节点上的能耗。Perlmutte是世界上最大的使用NVIDIA GPU的超级计算机之一。
结果很明显,使用NVIDIA A100 Tensor Core GPU加速时,能效平均提高了5倍。一款天气预报应用程序的能效提高了9.8倍。
GPU节省大量电力
NERSC发现,与一台双插槽x86服务器相比,一台配备四个A100 GPU的服务器的速度提升了高达12倍。
这意味着,在相同的性能水平下,GPU加速系统每月的能耗比仅使用CPU的系统少消耗588兆瓦时的能源。与仅使用CPU的系统相比,在四路NVIDIA A100云实例上运行相同的工作负载一个月,科研人员可以节省400多万美元。
测量真实的应用程序
这些结果意义重大,因为测量中使用了真实的应用程序,而不是合成基准测试。
能耗降低意味着8000多名使用Perlmutter的科学家可以应对更大的挑战,为取得更多突破打开了大门。
Perlmutter超级计算机配备了7100多颗A100 GPU,被用于众多科研项目。例如,科学家们正在用它探索亚原子相互作用,以寻找新的绿色能源。
全面推动科学进步
NERSC测试的应用程序涉及分子动力学、材料科学和天气预报。
例如,MILC模拟了将原子中的粒子结合在一起的基本力。它被用于推进量子计算、研究暗物质和寻找宇宙起源。
BerkeleyGW帮助模拟和预测材料与纳米结构的光学特性,这是开发更高效的电池和电子器件的关键步骤。
EXAALT解决了分子动力学中的一个基础性挑战,它在A100 GPU上运行时把能效提高了8.5倍。它让科研人员能够模拟原子运动的短视频,而不是像其他工具那样提供一系列快照。
第四个被测应用DeepCAM用于检测气候数据中的飓风和大气河流。当使用A100 GPU加速时,它的能效提高了9.8倍。
More Savings With Accelerated Computing
通过加速计算节约更多
NERSC的测量结果呼应了早期推算的加速计算潜在的节能效果。例如,在NVIDIA进行的一项单独分析中,GPU在AI推理方面的能效是CPU的42倍。
这意味着,如果将全球所有运行人工智能的仅使用CPU的服务器切换到GPU加速系统,每年可以节省10万亿瓦时的能源,相当于140万个家庭一年的能源使用量。
加速企业发展
不是只有科学家才能通过加速计算提高能效。
制药公司正在使用GPU加速的模拟和人工智能来加快药物发现的进程。宝马集团等汽车制造商正在用它为整个工厂建模。
NVIDIA创始人兼首席执行官黄仁勋曾表示,加速计算和AI正在推动行业高性能计算的革命,而这些企业正处于这场革命的最前沿。
-ends-