NVIDIA 正式发布 Vera:专为智能体打造的 CPU

性能超越 x86 处理器 1.8 倍,轻松驾驭跨行业多样化工作负载,创造更高数据中心 Token 营收。
作者

新闻摘要:

  • NVIDIA 推出兼具高性能与高能效的 Vera CPU,旨在为各行各业提供强劲算力支持,轻松驾驭包括智能体 AI、强化学习以及数据处理在内的多样化工作负载。
  • Vera 作为 CPU,将为独立的 Vera 服务器、NVIDIA Vera Rubin 系统以及 Vera BlueField-4 STX AI 存储平台提供算力支持。
  • Anthropic、OpenAI 和 SpaceXAI 等全球顶尖 AI 实验室,以及字节跳动、CoreWeave 和 Oracle Cloud Infrastructure 等超大规模云服务商,均已计划采用 Vera 来全面升级其 AI 工厂。
  • 正在大规模打造独立 Vera CPU 系统的制造商包括戴尔科技、HPE、联想和 Supermicro,以及华硕、仁宝、Foxconn、技嘉、和硕、云达科技 (QCT)、纬创资通和纬颖。

NVIDIA GTC 台北 —— NVIDIA 今日宣布,全球科技领军企业正计划采用 NVIDIA Vera——首款专为 AI 智能体打造的 CPU。

NVIDIA Vera 现已全面投产。作为一款全新类别的处理器,它的任务完成速度比传统 x86 CPU 快 1.8 倍,能够赋能各行各业多样化工作负载——涵盖智能体 AI、强化学习及数据处理等领域——从而为数据中心创造更高的 Token 营收。

Vera 建立在 NVIDIA Grace™ CPU 的成功基础之上——后者迄今出货量已近 250 万颗。针对现代数据中心里最严苛的 AI 工作负载,Vera 将 CPU 的性能与能效推向了全新高度。在这些场景中,AI 智能体正从简单的问答模式,进阶到能够执行具体行动、运行代码、调用工具并评估结果。

目前正在探索采用 Vera CPU 的客户包括金融领域领导者纽约证券交易所 (NYSE),Anthropic、OpenAI 以及 SpaceXAI 等全球顶尖 AI 实验室,还有字节跳动、CoreWeave、Lambda、Nebius、Nscale 和 OCI 等超大规模云服务商。此外,戴尔科技、HPE、联想和 Supermicro 等全球领先的系统制造商,以及一众台湾地区系统构建商,也正在将 Vera 集成至其 AI 基础设施中。

NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 智能体将成为计算资源的最大用户。Vera 正是为这一未来量身打造的首款 CPU——它具备卓越的性能、能效和可编程性,专为在超大规模下运行智能体 AI 而生。”

纽约证券交易所集团 (NYSE Group) 总裁 Lynn Martin 表示:“在纽约证券交易所,我们的核心重点是优化支撑我们无与伦比的基础设施的各项系统,不断提升其延迟表现、吞吐量和可靠性。纽约证券交易所每天处理的消息超过 1.1 万亿条。通过与 Redpanda 和 HPE 合作,采用 NVIDIA Vera CPU,我们将在进一步提升延迟优化的同时扩大系统容量,从而打造出一个高性能、高韧性且面向 AI 就绪的市场基础设施。”

作为知名 AI 模型 Claude 的缔造者,Anthropic 正在评估引入 Vera 来扩展其对 CPU 要求极高的智能体工作负载

Anthropic 计算负责人 James Bradbury 表示:“扩展算力是模型增长的重要加速器。我们很高兴看到 Vera 成为生态系统中一个极具潜力的组成部分,助力解决智能体工作负载的需求。”

搭载 NVIDIA Vera 的 OCI 超级集群,代表了超大规模 AI 超级计算领域的下一个前沿。

OCI 执行副总裁 Mahesh Thiagarajan 表示:“为了应对训练、推理和智能体 AI 激增的需求,OCI 正在迅速扩展其 AI 基础设施。通过部署 NVIDIA Vera CPU,OCI 将在下一代 AI 环境中,为高吞吐量的逻辑推理与数据处理工作负载提供强大支持。”据提供全面开源基准测试套件的 Phoronix 评测显示,NVIDIA Vera 在包括代码编译、Python、Java 和数据库处理在内的智能体工作负载中,均实现了最快的整体性能。这些工作负载处于现代 AI 工厂的关键环节——涵盖智能体工具调用与沙盒执行等场景,而更快的 CPU 性能将直接带来更高的智能体吞吐量与交互体验。

专为智能体时代打造的定制 CPU

AI 工厂的经济衡量标准正在从每美元能买多少“核心”,转向每美元能产出多少“Token”。这就要求 CPU 能够更快、更高效地完成智能体、数据处理以及任务编排等工作。

Vera 搭载了 Olympus 核心,这是 NVIDIA 专为应对上述转变背后的 CPU 工作负载而量身打造的定制 CPU 核心,涵盖了从 Python 运行环境、沙盒代码执行,到任务编排逻辑与分析流水线等各类工作。

Vera 专为处理海量指令、预判应用行为,以及在大量并发的环境、查询和数据处理任务间高效传输数据而生。它搭载了 88 颗 Olympus 核心、空间多线程技术,以及带宽高达 1.2TB/s 的 LPDDR5X 内存子系统。这些特性能够帮助智能体大幅减少在受限于 CPU 的步骤上的等待时间,从而让 AI 工厂里的加速器始终保持高速运转。

Vera CPU 可以灵活部署在整个 AI 工厂中——无论是独立的纯 CPU 基础设施,还是紧密耦合的加速计算系统。Vera 能够帮助 AI 工厂实现更高的端到端吞吐量,并缩短用户的解决方案交付时间,从而全面提升训练、推理以及智能体执行环节的响应速度与运行效率。

Vera 通过第二代 NVIDIA NVLink™-C2C 互连技术,担任 NVIDIA Vera Rubin 平台的主机 CPU。该技术支持 CPU 与 GPU 之间高达 1.8TB/s 的相干带宽,并将 NVIDIA 机密计算扩展至整机架规模,从而为智能体 AI 工作负载提供严密的安全保护。NVIDIA Vera BlueField-4 STX 处理器将 Vera CPU 与高性能网络、存储加速以及芯片级安全功能融为一体,从而构建出“设计即安全”的 AI 原生数据平台。

广泛的生态系统支持

Vera CPU 不仅适用于大规模智能体 AI 和强化学习环境的高密度液冷机柜,也适用于面向企业、云、数据处理及 AI 工厂部署的灵活双路风冷系统。

Aivres、ASRock Rack、华硕、仁宝、戴尔、Foxconn、技嘉、HPE、Hyve Solutions、Inventec、联想、MiTAC Computing、MSI、和硕、云达科技、Supermicro、纬创资通和纬颖等领先的基础设施厂商,都将提供基于 Vera CPU 的系统。其中,戴尔、HPE、联想和 Supermicro 等主要 OEM 厂商将推出搭载 Vera 的独立 CPU 服务器配置,为市场提供首个 x86 架构之外的标准化 CPU 选择。

计划部署 Vera CPU 的主要云服务提供商包括 Akamai、字节跳动、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、OCI、Redpanda、Starburst、Together AI 和 Vultr。

上市时间

自今年秋季起,系统构建商和云合作伙伴将陆续推出 Vera 系统。

更多详情,请观看 NVIDIA CEO 黄仁勋在 GTC 台北大会现场发表的主题演讲