从材料模拟到实验天文学,全新 NVIDIA AI 软件解锁科学发现

NVIDIA CUDA-X 库、微服务及参考代码正在加速科学领域的 AI 发展。
作者

在汉堡举行的 ISC 大会上,NVIDIA 推出了旨在加速科学 AI 的全新软件,应用领域涵盖化学与材料发现,乃至暗物质探索。

NVIDIA DAQIRI 库、全新的 NVIDIA ALCHEMI NIM 以及即将推出的 NVIDIA cuPhoton 参考代码,能够将原本需要在 CPU 上耗费数小时甚至数天才能完成的工作,转变为可实时运行的 GPU 加速流水线。

这些软件是 NVIDIA CUDA-X 的组成部分。CUDA-X 是一系列工具和库的集合,能够在包括 AI 和高性能计算在内的多个应用领域,带来显著的性能提升。

这些性能提升幅度巨大,并产生了切实影响。在各学科领域,科研人员正利用 AI 和加速计算,通过仪器和观测项目,以前所未有的速度生成数据与洞见。

例如,在 NVIDIA Grace Blackwell 机架级扩展系统上运行时,cuPhoton 能够加速天文台和望远镜收集的标准天文文件格式的 FITS 数据的加载、读取、处理和分析。在早期测试中,借助 cuPhoton,在加载和读取鲁宾天文台时空遗珍巡天项目 (LSST) 所采集的 FITS 图像时,速度提升了 14,900 倍。此外,借助 32 个 NVIDIA Grace Blackwell 超级芯片,其信号处理和分析速度提升了高达 8,400 倍。

归根结底,这意味着从史上最大的数码相机 —— LSST 相机中获取洞见的速度大幅提升。该相机能够拍摄数十亿个遥远星系,以及反射光线微弱的近处暗弱天体的图像。

全新软件赋能:从实验室到望远镜

这款全新软件正在加速暗物质、材料模拟等领域的研究。

NVIDIA cuPhoton 是一款专为科学家打造的参考代码,旨在帮助他们从望远镜、X 射线和激光实验中采集的多维数据中提取洞见。它专为加载、处理、分析和可视化 PB 级数据而构建,并可与其他 NVIDIA CUDA-X 技术结合使用,为天体物理学和天文学等领域构建端到端的加速流水线。

普林斯顿大学的研究人员与 NVIDIA 合作开发了 cuPhoton,未来还将联合哈佛大学,共同使用该工具,对天文台和暗能量巡天项目收集的海量数据进行处理与分析。

NVIDIA DAQIRI (Data Acquisition for Integrated Real-time Instruments 的缩写,即集成实时仪器数据采集) 是一款高性能网络库,能够将高速探测器和传感器产生的数据实时流式传输到 NVIDIA 软件中。传统系统受限于固定硬件,当仪器生成数据的速度超过存储速度时,往往会导致数据丢失。而 DAQIRI 能够在数据到达时实时处理数据流,有效解决这一难题。

在 CERN openlab 框架下,芝加哥大学和伦敦大学学院的科研人员共同开发了一项名为 A-GHOST 的研究项目。该项目利用 DAQIRI 在 CERN ATLAS 实验记录的碰撞数据进行实时 AI 分析。由于存储限制,ATLAS 实验通常会丢弃超过 99% 的数据,而 A-GHOST 能够对这些被丢弃的数据进行分析,从而捕捉到原本会丢失的潜在重要信号。

NVIDIA ALCHEMI 包含一系列专业领域的微服务和工具包,旨在加速化学与材料发现,应用范围涵盖电池材料、催化剂、OLED 显示器、美妆产品等。

NVIDIA 于 3 月份发布了两个 ALCHEMI NIM,分别用于批量几何结构弛豫 (BGR) 和批量分子动力学 (BMD)。这些由 AI 加速的工具使研究人员能够同时对数百万个分子和材料进行模拟:BGR 用于寻找最稳定的结构,BMD 用于模拟它们随时间变化的运动行为。

此外,ALCHEMI 预计将于近期加入针对广泛使用的 Vienna Ab initio Simulation Package (VASP) 的微服务,使研究人员能够以更高的 GPU 吞吐量运行材料模拟。通过利用 NVIDIA 多进程服务 (Multi-Process Service) 在单个 GPU 上运行多个 VASP 计算,该微服务将几何结构优化 (即寻找材料中原子最稳定排列的过程) 的速度提升了 3 倍。

同时,开发人员和研究人员还可以使用 ALCHEMI Toolkit 来加速名为“机器学习原子间势”的 AI 代理模型的训练,并轻松构建定制化的高性能原子级模拟工作流。

Lila Sciences 如何借助 NVIDIA ALCHEMI 不间断地运行科学方法

Lila Sciences 正在为生命科学、化学和材料科学打造科学超级智能平台和自主实验室。该公司与 NVIDIA 合作,利用 ALCHEMI 进行了高保真磁性模拟,并于今年 3 月在圣何塞举行的 NVIDIA GTC 上进行了展示。

借助用于 BGR 的 ALCHEMI NIM,Lila Sciences 将高通量材料筛选速度提升了 50 倍,成功识别出更具合成潜力的稳定候选材料。随后,利用早期测试版的 ALCHEMI VASP,将入围候选材料的磁性能计算速度提升了 30%。

Lila Sciences 使用 NVIDIA ALCHEMI 进行材料模拟。上图由 Lila Sciences 提供,展示了从溅射仪中合成的样品上切割下来的薄膜试样。溅射仪是一种用于在表面生成超薄、高度均匀的金属或陶瓷涂层的系统。

这种加速效果还会叠加放大。ALCHEMI 为 TensorNet 提供的专用内核,使 Lila Sciences 的训练和推理速度提升了 6 倍,内存占用降低为原来的 1/3,将过去需要数周才能完成的模拟缩短至数天。

这种方法不再局限于一次只运行一个实验,而能够在 GPU 内存中同时评估多种材料。它还可以推广应用于以下场景:

  • 材料发现:大规模筛选新型稳定的材料组合。
  • 能源:发现用于生产化学品和燃料的高活性、地球储量丰富的催化剂。
  • 电磁学:理解和预测复杂的磁性行为。

ALCHEMI 位于模拟层,负责生成物理科学数据,为整个闭环的后续环节提供支撑。

此外,Lila Sciences 利用完整的 NVIDIA 软件栈加速科学发现,使用 NVIDIA Megatron-LMNVIDIA Nemotron (包括 Nemotron 3 Nano 和 Nemotron 3 Super 开放模型,以及 NeMo RL 和 NeMo Gym 库) 进行模型训练。该公司还利用 NVIDIA BioNeMo 进行分子生成,使用 NVIDIA TritonNIM 提供推理服务,并借助 NVIDIA Omniverse 库构建数字孪生。

Lila Sciences 联合创始人兼首席技术官 Andy Beam 表示:“这项工作展示了如何利用强大的计算技术栈加速科学发现,其规模是任何科研人员凭一己之力都无法实现的。”

上市时间

NVIDIA ALCHEMI ToolkitToolkit-Ops 现已可通过 GitHub 和 PyPI 下载。ALCHEMI NIM 现已可通过 NVIDIA NGC 目录下载。针对 VASP 的 ALCHEMI NIM 预计将于今年夏末推出。

DAQIRI 现已可以通过 GitHub 获取。CuPhoton 预计将于今年夏季推出。

了解更多关于 NVIDIA 科学 AI 的信息。

请参阅关于软件产品信息的说明