NVIDIA Vera CPU 为洛斯阿拉莫斯国家实验室的智能体科学 AI 开启新篇章

搭载 Vera CPU 的 Mission、Vision 和 Veritas 超级计算机,将推动材料模拟、科学 AI 智能体以及分子设计的发展。
作者

Mission、Vision 和 Veritas 是由 HPE 与 NVIDIA 合作为洛斯阿拉莫斯国家实验室 (LANL) 打造的新一代超级计算机。它们将采用 NVIDIA Vera CPU 来加速科学发现,进一步解锁面向科学研究的智能体 AI。

这些超级计算机将采用 HPE Cray Supercomputing GX5000 架构,并搭载 NVIDIA Vera Rubin 平台。该平台整合了 NVIDIA Vera CPU、NVIDIA Rubin GPU 以及 NVIDIA Quantum-X800 InfiniBand 网络。

根据规划配置,Mission 将配备 NVIDIA Vera Rubin GPU 节点,以及 2300 个基于 HPE Cray Supercomputing GX240 刀片服务器的独立 NVIDIA Vera CPU。Veritas 则将配备约 1150 个独立 NVIDIA Vera CPU,以配合 NVIDIA Vera Rubin 节点协同工作。

Veritas 将与 Mission 和 Vision 同步交付,主要用于支持实验室主导的研究与开发 (LDRD) 项目,助力加速科学领域智能体 AI 的发展。该系统还将对这些技术进行测试,为 LANL 正在建设的大型系统提供验证。 

研究人员正在为科学研究引入一项新工具 —— AI 智能体。这些 AI 智能体能够提出假设、选择工具、启动模拟、分析输出结果,并优化下一步行动。LANL 针对通用研究与科学智能体 (URSA) 开展的公开研究,正是这一发展方向的探索。URSA 目前运行于 Venado 上,未来也将部署至 Mission 和 Vision。它是一个模块化、反馈驱动的 AI 框架,旨在帮助科研人员构思假设、规划实验、运行模拟并分析结果。

LANL 的测试结果显示,在处理 URSA 工作负载时,Vera CPU 的性能较 Crossroads x86 超级计算机所用 CPU 提升了 7 倍。

专为智能体与模拟打造的 Vera CPU

LANL 的早期测试结果显示,在运行开源蒙特卡洛传热仿真工具 Branson 时,NVIDIA Vera CPU 的性能较 Crossroads x86 超级计算机所用 CPU 性能提升超过 3 倍。

这一测试结果得益于 Vera 的多项核心特性,包括其定制的 Olympus 核心、LPDDR5 内存以及高速片上互连架构。

单个 Vera CPU 的性能比单路的 x86 架构 CPU 高出 3 倍以上,同时每核心内存容量提升超过 4 倍,每节点内存容量提升了 6 倍。归根结底,这意味着 LANL 能够以更快地速度得出科研成果。

该实验室的所有超级计算机均由硬件架构师、系统软件开发人员、相关领域科学家、计算机科学家和应用数学家共同协同设计 —— 这确保了系统是基于真实的科研工作负载来打造的,而不仅仅是为了满足抽象的基准测试。

传承 LANL 历代超算系统的经验 

预计于 2027 年投入运营的 Vision 系统,将作为基础科学研究的计算资源,涵盖材料、能源建模、生物医学研究以及 AI 等领域 —— 它能让更多的科研人员在开展高重要性的研究之前,先行测试新方法、训练模型并探索创新思路。

这项工作延续了 LANL 与 NVIDIA 十多年来在 CPU 领域的深度合作。从 Grace 到 Vera,双方一直采用极致协同设计理念来满足 LANL 对模拟工作负载的需求。

这三台全新的超级计算机建立在 Venado 的基础之上。Venado 是一台搭载 NVIDIA Grace Hopper 超级芯片和 NVIDIA Grace CPU 超级芯片的 HPE Cray EX 超级计算机,于 2024 年在洛斯阿拉莫斯国家实验室完成安装。

了解更多有关 NVIDIA Vera CPU 的信息。