在 SC19 上,GPU 加速器助力超级计算机实现 AI 和百万兆级计算

by Rick Merritt

SC19 将于下周在“里高之城”丹佛举行,届时,GPU 将成为一些功能强大的超级计算机中计算科学的关键要素。

在今年的年度超级计算活动中,关于 AI 和百万兆级计算性能的竞赛已成为热门话题。对于这两个领域,专家都依赖 GPU 加速器。

在周一下午 3 点(美国山区时间)的特别致辞中,NVIDIA 创始人兼首席执行官黄仁勋将为大会拉开序幕。(在观看适合移动设备的直播。)他将深入介绍 GPU 的最新创新成果,以及它们如何改变计算科学和 AI。

对大脑、地震等进行建模

NVIDIA 展位上的一些演示可让与会者近距离了解 GPU 如何推动科学发展。NVIDIA Quadro RTX GPU 将用于对地震进行可视化,NVIDIA V100 Tensor Core GPU 将以纳米级分辨率显示人脑模拟。

十家合作伙伴将使用 NVIDIA GPU 演示产品:ASRock Rack、Bright Computing、Boston、BOXX、Colfax、KISTI、Microway、One Stop Systems、Penguin Computing 和 Silicon Mechanics。

除了黄仁勋的概述性演讲外,还有许多其他有关 GPU 如何通过深度学习来助力高性能计算的会议。

SC19 上将针对 AI 或 GPU 推出三场专题技术研讨会、两场专题研讨会和三场邀请报告。例如,在一场邀请报告中,来自太平洋西北国家实验室的一位主任将介绍六个主要的研究方向,以提高机器学习对科学问题的影响。

另一场邀请报告中,白宫科技政策办公室 AI 部门助理主任将分享政府在 AI 和 HPC 方面的优先事项。她将详细介绍美国总统在二月份宣布的美国 AI 计划。

深入讨论深度学习

一组专家将在周一上午深入讨论如何使用高性能计算机进行深度学习。他们包括来自弗劳恩霍夫研究所、NVIDIA 和橡树岭国家实验室的高级工程师、科学家和研究人员。

田纳西大学教授、负责维护世界大型超级计算机 500 强名单的三位专家之一 Jack Dongarra 说:“如今,机器学习被应用到计算科学的许多领域,我们感到很兴奋。随着我们不断取得进展,我期望人工智能能够在科学领域发挥越来越重要的作用。”

回到 NVIDIA 的展台,解决方案架构和工程部门副总裁 Marc Hamilton 将开启由十几位演讲者带来的精彩演讲,其中 Mellanox 将围绕快速网络进行演讲。

其他演讲者将提供有关 NVIDIA 合作伙伴关系(以加速基于 Arm 的超级计算机)以及 OpenACC(一种可用于 200 多个应用程序的并行编程模型)的最新信息。在在周二下午的单独会议上,OpenACC 总裁、NVIDIA 战略合作经理 Duncan Poole 将主持一场关于 OpenACC 的兴趣小组会议。

追踪百万兆级计算竞赛

同时,许多人都盯着百万兆级计算的终点线,因为这意味着超级计算机的计算能力可以达到超过每秒一百万兆次浮点运算或 1018 FLOPS。实现百万兆级计算,就像 2008 年打破千兆级别的壁垒一样,是超级计算领域的一个里程碑,并且最近已激励这个行业开始采取行动。

这可以说,百万兆级计算时代已经开始了。当今功能极为强大的超级计算机,即橡树岭国家实验室的 Summit 系统已取得了一些百万兆级计算的里程碑。Summit 中的 27,648 个 NVIDIA V100 Tensor Core GPU 可以在 AI 任务上提供 3.3 百亿亿次浮点运算的混合精度计算能力。

利用其能力,政府和学术研究人员使用 AI 来确定易受阿片成瘾和慢性疼痛影响的基因根源,并凭借此共同获得 2018 年戈登贝尔奖。他们针对美国亟需解决的流行病之一所做的工作使 Summit 上的 GPU 达到了 2.36 百亿亿次浮点计算。

在全球 500 强系统中,已有 125 个系统使用了 NVIDIA GPU。除了 Summit,它们还包括世界上排名第二、第六、第八和第十的强大系统。在过去的几年里,设计师越来越依赖于 GPU 加速器来推动这些大型钢铁巨兽达到新的性能高度。

如需详细了解 SC19 上的 NVIDIA 活动,请参阅我们的活动页面