Tesla+NVLink!美国将打造两台旗舰超级计算机

作者 英伟达中国

美国能源部近期公布计划,将打造两台GPU加速的超级计算机(计划于2017年建设完毕),它们将基于下一代IBM POWER服务器,并采用NVIDIA Tesla GPU加速器和NVIDIA NVLink高速GPU互联技术,可带来至少3倍于当前最强超算系统的性能,让人类距离百亿亿次级计算目标更近一步。

这两台超级计算机分别为“高峰”(Summit)、“峰峦”(Sierra)。其中,前者将部署在橡树岭国家实验室,可提供150到300 Petaflops的峰值性能,用于开放科学领域,如实现更大程度的美国能源独立,找出抑制气候变化的新方法,大幅改善燃料效率,自然灾害预测等;后者可提供远超100 Petaflops的峰值性能,将是劳伦斯利弗莫尔国家实验室国家核安全任务的一大关键要素。

这两台超级计算机的运算速度将大幅高于美国当前的速度冠军“泰坦”(Titan)以及当今全球最快的超级计算机天河二号(Tianhe-2)。橡树岭国家实验室的“泰坦”可提供27 Petaflops的峰值性能,而中国的天河二号可提供55 Petaflops的峰值性能。

美国当前的速度冠军“泰坦”

美国当前的速度冠军“泰坦”

NVIDIA联合创始人兼首席执行官黄仁勋先生表示:“今天的科学是明天的技术。从量子到全球再到银河系,科学家正在解决巨大的难题。他们的工作依赖越来越强大的超级计算机。通过发明GPU加速,我们铺就了通往百亿亿次超级计算的道路,为科学家实现难以想象的发现而提供了工具。”

这两台系统标志着IBM与NVIDIA之间的合作伙伴关系达到了首个重大里程碑。这两台系统基于OpenPOWER Foundation的成果而打造,OpenPOWER Foundation是一个开放的开发社区,其目标是为高性能计算和企业数据中心用户开发下一代计算解决方案。

新技术加快百亿亿次级计算

超级计算界多年以来一直为打造百亿亿次级系统而不懈努力,百亿亿次级系统每秒钟可以执行一万兆次浮点运算,一次浮点运算即为1 FLOPS,它相当于一次数学运算,例如两个数相乘。凭借大量突破性的技术,“高峰”和“峰峦”将是人类向百亿亿次级计算水平迈出的重要一步。

其中一项突破性技术是NVIDIA NVLink高速GPU互联,该技术将集成在NVIDIA GPU和IBM POWER CPU当中,这两台新系统采用的正是这些GPU和CPU。NVLink让GPU和CPU共享数据的速度能够达到当今的5到12倍,该技术旨在最终造就比当今最快的系统还要快50到100倍的超级计算机。

这两台系统还将采用NVIDIA未来的GPU架构Volta,该架构的性能将大幅高于NVIDIA当前的Maxwell架构和接下来的Pascal架构。这些NVIDIA GPU的计算性能将远高于当今任何处理器的水平,其性能将占到“高峰”和“峰峦”峰值浮点处理能力的90%以上。

Tesla加速器拥有大幅领先CPU的加速性能
Tesla加速器拥有大幅领先CPU的加速性能

橡树岭国家实验室的橡树岭领先计算设施项目总监Buddy Bland表示:“我们的用户面临最复杂的科学难题,他们需要异常强大的计算机来满足国家的目标。如果没有这些技术的结合,‘高峰’的规划性能则不可能实现。该系统将给我们的用户带来强大的工具,让他们能够完成这些目标。”

高峰将加速开放科学计算

像泰坦一样,“高峰”也将专门用于开放科学。这意味着,世界各地的研究人员都将有机会申请使用该系统。“高峰”还将提升节能计算的标准,提供比泰坦高5到10倍的性能,而耗费的功率仅比泰坦高10%。

峰峦将支持国家安全

“峰峦”的计算性能将比劳伦斯利弗莫尔国家实验室当前最快的系统“红杉”(Sequoia)还要快5到10倍,后者性能为20 Petaflops。“峰峦”将被用于国家核安全管理局的计划,以便在不开展测试的情况下确保美国核威慑的安全性、安保以及有效性,同时还将被用于防扩散工作以防止大规模杀伤性武器在全球扩散。

百亿亿次级计算的潜能和挑战

人们期待利用百亿亿次超级计算机在科学、工程以及工业的各个领域中进一步取得发现,例如让人们能够找出治愈疾病的方法、深入了解人脑、帮助缓解气候变化的效应、增进我们对宇宙起源的了解。

然而,打造百亿亿次级系统的一大根本难题是实现更高性能的同时必须最大限度降低能耗,而GPU加速器特别适合这一任务。一台利用NVIDIA最新GPU加速器打造的百亿亿次级系统在功耗上比基于x86 CPU的系统低五倍,从而让系统设计师能够实现远比从前更节能的性能。

关于NVIDIA Tesla加速的计算平台

Tesla加速的计算平台完全专为下列应用而打造:节能的高性能计算、计算科学、超级计算、企业应用、复杂的数据分析以及机器学习等应用。与单纯使用CPU的方式相比,该计算平台能够提供大幅提升的性能与节能性。这一平台深深地集成在全球最快的GPU加速器、先进的系统管理特性、加速的通信技术以及NVIDIA CUDA当中。