NVIDIA Vera CPU 在竞争中展现强劲性能

向智能体 AI 的转型，为 AI 工厂提出了全新的 CPU 需求：即需要更快的核心、超大内存带宽、以及在所有核心同时运行时仍能持续保持高性能的能力。

Phoronix 今日公布的初步基准测试结果显示，NVIDIA Vera CPU 完美契合了这一需求。此次基准测试，主要聚焦于 Vera 针对现代数据中心中智能体工作负载的能力表现。

Vera CPU 在优化平台功耗的同时，提供了 AI 工厂所需的吞吐量。它搭载了 88 颗 NVIDIA 定制的 Olympus 核心、拥有 1.2TB/s 的内存带宽以及高速片上互连架构，打造出一款在保持出色能效的前提下，将核心性能与内存带宽完美结合的 CPU 平台。

NVIDIA Olympus 展现出令人瞩目的强劲性能

Vera 的核心在于 NVIDIA 自研的 Olympus CPU 核心。Olympus 完全兼容 Armv9.2 指令集架构，专为支撑智能体 AI 的串行 CPU 任务而设计，包括分支密集运行时环境、沙盒代码、数据处理以及任务编排。

Vera 采用单片式裸片设计、宽核心架构、先进的分支预测技术以及第二代 NVIDIA 可扩展一致性互连架构 (NVIDIA Scalable Coherency Fabric)，从而确保数据在全部 88 颗核心之间的高效传输。

Phoronix 对单路 Vera CPU 的测试显示，其热设计功耗 (TDP) 为 450 瓦，而内存功耗不到 30 瓦。测试结果显示，Vera 在这一功耗范围内展现了卓越的性能，并且在代码编译、文件压缩、视频转码、Python、Java 和数据库管理等广泛的工作负载中，均实现了代际性能跃升。

这些正是智能体和 AI 工厂每天都要运行的 CPU 密集型任务，包括代码编译、运行时执行、数据压缩、数据库查询以及大型软件堆栈的协调。

Phoronix 的创始人兼首席撰稿人 Michael Larabel 写道：“在开始测试之前，我其实并不确定搭载全新 Olympus 核心的 NVIDIA Vera 会有怎样的表现。但最终的结果让我意识到，这是迄今为止，英特尔和 AMD x86_64 处理器所遭遇过的最强劲挑战。”

内存性能展现出“惊人优势”

智能体工作负载不仅受限于核心数量，还需要极高核心利用率和持续稳定的内存带宽。因此，每瓦内存性能成为衡量 CPU 整体效率的关键指标。

Vera 搭载了第二代 LPDDR5X 内存子系统，相较传统 DDR5 可大幅降低每比特能耗。这让 Vera 能够提供高达 1.2 TB/s 的超大带宽 —— 在内存功耗低于 30 瓦的情况下，其峰值内存带宽可达到传统 CPU 的两倍。相比之下，传统 DDR5 的功耗通常超过 100 瓦。

在 Phoronix 的 STREAM TRIAD 测试中，Vera 能够持续保持其峰值内存带宽的 90%。在 Phoronix 迄今为止所有受测 CPU 中，创下了最高的峰值带宽达成率纪录。同时，与传统 x86 CPU 相比，Vera 每核心的内存带宽提升超过 4 倍。

Larabel 写道：“搭载 LPDDR5X 内存的 NVIDIA Vera，在内存性能上展现出了惊人的优势，远超目前的 Intel Xeon (至强) 和 AMD EPYC (霄龙) 处理器。”

然而，峰值带宽仅仅是整体性能表现的一部分。AI 工厂的工作负载需要同时运行大量的沙盒、工具调用和数据服务。Prime Intellect 在对 Vera 进行的独立测试中发现，随着并行工作负载的增加，Vera 依然能够保持高带宽以及低且稳定的内存延迟——这正是智能体 AI 所需要的可预测的性能表现。

巨大的代际飞跃 —— 并在 Phoronix 测试中展现出领先优势

与上一代 NVIDIA Grace CPU 相比，Vera 在 Phoronix 的测试中实现了 1.6 倍的几何平均性能提升——这是一个令人难以置信的代际飞跃。

Larabel 写道：“从 Grace 到 Vera，其代际性能的提升一次次超出了我对处理器常规迭代性能进步的预期。NVIDIA Vera CPU 凭借其自研的 Olympus CPU 核心，展现出了极其强悍的实力，其在与 Intel/AMD x86_64 处理器的竞争中表现出的竞争力，是我在其他任何 ARM 或非 x86_64 架构处理器上从未见过的。”

在所有参与测试的 CPU 中 Vera 拔得头筹，与最新一代的 128 核 x86 处理器相比，其整体性能优势达到了 1.5 倍。这种性能提升在实际的开发者工作负载中得到了直观体现。单路 Vera 仅用 20 秒就完成了默认 Linux 内核编译，创下了 Phoronix 在该项测试中的最快纪录。若按单核心计算，Vera 的 Linux 内核编译速度是 128 核处理器的两倍。

Larabel 写道：“在 (几何) 平均性能的基础上，NVIDIA Vera 的表现比 AMD EPYC 9575F 5.0 GHz 高频处理器还要高出 10%。”

Vera 已进入客户测试阶段，合作伙伴相关产品即将面世

在 NVIDIA GTC 上，NVIDIA 宣布 Vera 已获得广泛的生态系统支持，涵盖了 AI 原生企业、超算中心、云服务提供商以及基础设施供应商。

此外，NVIDIA 已经将首批 Vera CPU 交付至领先的 AI 公司和云服务提供商，这标志着一个重要里程碑，Vera 正稳步迈向今年下半年通过合作伙伴全面供货阶段。

Vera 将提供双路和单路两种系统配置，并配备风冷与液冷选项。该方案旨在支持 AI 工厂部署，应用场景涵盖从标准企业数据中心到高密度的智能体 AI 基础设施。

了解更多关于 NVIDIA Vera 的信息。