量子危机:锁定 COVID-19 的原子键加州大学河滨分校的容器借助部署在微软 Azure 云中 NVIDIA GPU 的强大功能开展冠状病毒研究

作者 Geetika Gupta

Anshuman Kumar 正在逐渐突破技术局限,以破解冠状病毒的秘密。

他和加州大学河滨分校(UCR)的同事们想要以一种前所未有的规模来计算这种病毒的原子间相互作用。如果他们成功了,他们将看到病毒分子与药物分子结合的过程,从而防止其感染健康细胞。

Kumar是UCR 团队的一员,该团队将量子力学的微观世界提升到了一个新的水平。他们的目标是测量所谓的“势垒高度”,即与病毒蛋白质(大约由5000个原子组成)发生相互作用所需的能量。

这领先于该领域最新技术的 10 倍以上,截至目前,该技术已经计算出了由数百个原子组成的分子间的作用力。

助力抗新冠病毒药物研究

这些关于如何通过原子力判断病毒与中和分子(配体)结合的可能性的数据,可以帮助制药公司找到预防新冠肺炎的药物。

项目负责人 Bryan Wong 是加州大学河滨分校化学工程、材料科学和物理学副教授,他说:“牛顿力学并不适用于原子水平,因此必须使用揭露微观层面自然运作方式的量子力学。我们的目标是借助部署在微软 Azure 云中的 NVIDIA GPU 来快速、高效地进行计算,从而加快我们的研究进程。”

研究人员于4月下旬开始使用冠状病毒上的一种蛋白质进行研究,该蛋白质被认为在感染健康细胞的过程中起着重要作用。他们现在正在完成一系列初步计算,每步计算最多需要10天。

研究的下一步是探索“势垒高度”,它将涉及到更加复杂、更加耗时的计算。单就一个蛋白质/配体对的研究时间可能需要五个星期。

在 Azure 云中使用 GPU

为了更快地推进研究进程,该团队通过 COVID-19 高性能计算联盟获得了 Microsoft AI 卫生计划的资助,包括在 Microsoft Azure 云上运行高性能计算的许可以及 NVIDIA 的帮助。

Kumar 使用的是适用于科研项目的 GPU 加速版本,可以处理量子计算。它已经在UCR 由 NVIDIA GPU 供能的本地簇上运行,但是该团队希望“上云”,以将其运行在 V100 Tensor Core GPU 上。

在不到一天的时间里,Kumar 在 NVIDIA 解决方案架构师 Scott McMillan 的帮助下,通过 NVIDIA 创建和维护的开源工具 HPC Container Maker 将程序迁移到Azure。通过这个工具,用户只需单击几下即可定义一个用于识别程序及其关键组件的容器,例如运行环境和其他依赖项。

【配图文字】Anshuman Kumar 使用了 NVIDIA 开发的开源程序,将 UCR 的软件迁移到了部署在微软 Azure 云中的最新GPU。

公司首席营销官 Shezaf 补充解释,受海洋的阳光照射、天气状况、拥挤的人群以及在海中正常活动的人(部分身体没入海中)的影响,图像训练过程并不容易。

鉴于研究人员以前从未使用过容器或云服务,这次成功迁移意义重大。

“只要确定了正确的库和依赖项,这个过程就会变得非常顺畅,因为后续工作只剩下编写脚本和构建代码映像,” Kumar 说, “与本地系统相比,部署在 Azure 上的 GPU 帮助我们提速了2-10倍。”

NVIDIA 在其中确保代码使用的 CUDA 和 Magma 数学库是最新版本,从而帮助微调性能。一位专员深入研究堆栈,以更新启用多 GPU 缩放的进程。

新队友和吉祥物

最近,该团队在 UCR 发现了一个独立的计算生物学实验室,并由此得到意向不到的帮助。该实验室也获得了 HPC 财团用于支持新冠肺炎研究的拨款,实验室使用统计采样技术观察病毒与配体的结合过程,以增加原本很少发生的结合的发生频率。

Wong说:“我之所以向他们伸出援助之手,是因为这次联手可能派生出一个更好的项目。” 他补充说,“他们可以使用 Anshuman 设计的GPU代码来改进采样工作。”

Kumar说:“我为自己能参与这项工作感到非常自豪,因为它可以帮助整个世界。”

该团队最近还拥有了“吉祥物”。如今,每天都有一只大松鼠坐在Wong的办公室窗外,团队称它为 Billy,并视它为团队追求快速敏捷的最佳象征。

*封面图中的彩色带代表 Mpro 蛋白,这是一种被认为在冠状病毒的复制过程中起重要作用的蛋白。 红色链代表与配体结合的生物分子。 (图片由UCR提供。)