维康桑格研究所是国际人类基因组计划的重要贡献者,该研究所正在使用 NVIDIA 加速计算技术来节省能源,同时挽救生命。
作为全球最大的基因测序机构之一,这家位于英国的研究所已读取了超过 48 个 Petabase(或 48 千万亿个碱基对)的 DNA 和 RNA 序列,以提炼有关健康和疾病的关键洞察。
为了研究引发癌症形成的突变过程以及决定治疗效果的基因变异,该研究所的癌症、衰老和体细胞突变(CASM)项目每年对数万个癌症基因组进行测序和分析。
为了如此大规模研究的顺利进行,维康桑格研究所正在尝试使用具备 NVIDIA Parabricks 的 NVIDIA DGX 系统。NVIDIA Parabricks 是一个可扩展的基因组学分析软件套件,它利用加速计算,将数据处理时间缩短至几分钟。
维康桑格研究所 CASM 主要软件开发人员 Jingwei Wang 表示:“维康桑格研究所每年要处理数十万份体细胞样本。NVIDIA 加速计算和 Parabricks 将为我们的样本分析工作节省大量时间、成本和能源。我们十分高兴能够借助 NVIDIA Grace、Grace Hopper 等 NVIDIA 的先进架构来提高性能和效率。”
减少运行时间和能耗
维康桑格研究所致力于开发高通量癌症样本模型,这些模型可用于全基因组功能筛选和药物测试。
NVIDIA 加速计算和软件大大减少了该研究所每个基因组的分析运行时间和能耗。
为了使用 Burrows-Wheeler Aligner(BWA,一个用于根据大型参考基因组绘制 DNA 序列的软件包)加速基因组分析,维康桑格研究所使用了其在 CPU 上运行的自主工作流 CaVEMan,并且正在尝试利用 NVIDIA GPU 上的 Parabricks。
该研究所使用一个 NVIDIA DGX 系统,和使用 128 台双路 CPU 服务器时相比,就将运行时间缩短了 37.5%,成本和能耗也将分别减少 96% 和 98%。
该研究所每年每测序 1 万个基因组,就要消耗约 1.25 亿个 CPU 小时。
这意味着,维康桑格研究所如果改为通过 GPU 上的 Parabricks 使用 BWA,每年可节省 100 万美元和 1000 兆瓦时的电,这相当于一个美国普通家庭 100 年的用电量。
与行业领先者合作
维康桑格研究所的 NVIDIA 加速测序实验室可谓是一个 AI 工厂。只要给它输入数据,就能生产出智能。
AI 工厂是拥有先进全栈加速计算平台的下一代数据中心,可执行最密集的计算任务。
在研究对于发现新癌症基因和突变过程至关重要的科学问题时,维康桑格研究所正在通过将 NVIDIA 基础设施用于其 AI 工厂,来提高运营和能源效率。
另外,建造 AI 工厂的企业和组织正在与能源管理和自动化公司施耐德电气等领先企业开展跨行业合作,通过优化数据中心的设计,以最节能的方式运行苛刻的工作负载。
维康桑格研究所正在与施耐德电气一起,尽可能减少数据中心的停机时间,同时为 DNA 测序实验室的数据中心配备不间断电源和冷却设备,以及其他关键的节能技术。
在今年 3 月举行的 NVIDIA GTC 大会上,施耐德电气宣布将发布专为 NVIDIA 加速计算集群定制的 AI 数据中心参考设计,以帮助各个行业的企业机构优化基础设施。
这些参考设计专门用于数据处理、工程仿真、电子设计自动化、计算机辅助药物设计和生成式 AI,将侧重于可扩展、可持续、高性能数据中心的大功率配电、液冷系统等方面。
在本周由《经济学人》杂志主办的纽约气候周专题讨论会上,来自维康桑格研究所、施耐德电气和 NVIDIA 的代表将介绍他们的工作。
进一步了解有关可持续计算和维康桑格研究所可能挽救生命的工作。
主图由维康桑格研究所提供。