- NVIDIA Vera Rubin 正全面迈向规模化量产。台湾地区顶尖服务器制造商与全球供应链领导者正大规模制造基于 Vera Rubin 的系统 —— 为 AI 实验室、云服务商和超大规模数据中心提供强劲动力,共同构建未来智能世界。
- Vera Rubin 为下一代 AI 工厂提供了 POD 级基础架构 —— 与上一代 NVIDIA Grace Blackwell 平台相比,其在大规模部署时智能体吞吐量提升了 10 倍。
- 凭借成熟且开源的 MGX 设计,NVIDIA 全球供应链生态系统的数百家合作伙伴,正通过遍布 30 个国家和地区的 350 多家工厂,加速 Vera Rubin 量产。
- Vera Rubin 推出的 NVIDIA Spectrum-X 以太网硅光技术现已全面量产——通过将光电一体化封装 (CPO) 技术与 Spectrum-X 交换机深度融合,赋能百万 GPU 规模的 AI 工厂。
NVIDIA 今日正式宣布,NVIDIA Vera Rubin 平台正加速进入全面量产阶段,旨在为全球智能体 AI 工厂注入强劲动力。
台湾地区顶尖服务器制造商与全球供应链领导企业正大规制造基于 Vera Rubin 的系统,为 AI 实验室、云服务提供商及超大规模数据中心运营商提供强劲动力,共同构建未来智能世界。
Vera Rubin 提供了 NVIDIA 迄今为止规模最大的 POD 级平台 —— 由五个专用机架协同运作,构成一台面向智能体工作负载的巨型 AI 超级计算机。该平台将 NVIDIA Vera Rubin NVL72 系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX 存储以及 NVIDIA Spectrum™-6 SPX 以太网这五种机架整合为一个高度集成的统一系统。与上一代 NVIDIA Grace Blackwell 平台相比,Vera Rubin 在大规模部署时的智能体吞吐量提升了 10 倍。
“智能体 AI 是一种全新的工作负载。仅仅一个提示词,就可能触发一个包含推理、检索、工具调用和响应生成在内的多个环节,背后可能涉及数千个步骤。”NVIDIA 创始人兼首席执行官黄仁勋表示:“Vera Rubin 正是为这一刻而生——它是一台能够规模化输出智能的 AI 工厂引擎,具备驱动下一次工业革命所需的性能、能效与安全性。”
Vera Rubin 全面迈向规模化量产
Vera Rubin 标志着第三代 NVIDIA MGX™ 机架级系统的问世。凭借成熟且开源的 MGX 设计,NVIDIA 遍布 30 个国家、350 多家工厂的数百家供应链生态合作伙伴,正在全力加速 Vera Rubin 的量产与部署。
顶尖系统构建商、基础设施软件及存储合作伙伴正全力投入 Vera Rubin 的规模化生产,其中包括戴尔科技、HPE、联想和 Supermicro,以及 AIC、Aivres、ASRock Rack、华硕、Cloudian、仁宝、DDN、Everpure、Foxconn、技嘉、Hitachi Vantara、Hyve Solutions、IBM、Inventec、MinIO、MiTAC Computing、MSI、NetApp、Nutanix、和硕、云达科技(QCT)、VAST Data、WEKA、纬创资通和纬颖等企业。
构建百万 GPU 规模的 AI 工厂基础架构
为支持 AI 工厂横向扩展和跨区域扩展部署,Vera Rubin 平台引入 NVIDIA Spectrum-X™ 以太网硅光技术,这是全球首款基于光电一体化封装技术 (CPO)、支持 200Gb/s SerDes 的交换机,现已全面量产。
Spectrum-X 以太网硅光技术是基于 CPO 打造的新一代交换技术。与使用传统收发器的网络相比,其能效提升 5 倍、AI 运行时间提升 5 倍,部署时间加快 1.3 倍。
凭借简化设计并为计算任务释放更多电力,NVIDIA 光电一体化封装技术网络为百万 GPU 规模的 AI 工厂提供了基础架构。CoreWeave、Lambda 以及 Oracle Cloud Infrastructure 等生态合作伙伴已率先采用该技术。
NVIDIA Vera Rubin 平台还集成了 NVIDIA BlueField®-4 DPU,提供速度高达 800Gb/s 的软件定义网络能力,并内置多租户隔离机制。借助 NVIDIA BlueField-4 高级安全可信资源架构 (Advanced Secure Trusted Resource Architecture),客户能够简化网络运维、增强租户隔离,并在百万 GPU 规模的 AI 集群中实现更精细的资源与安全控制。
为 AI 工厂打造的安全 AI
AI 工厂正越来越多地处理专有数据、受监管内容以及在智能体工作流中运行的关键任务模型。这就需要针对自主智能体量身定制的高级基础设施安全防护,尤其是在那些无法默认信任基础设施的共享或云环境中。
Vera Rubin 平台在设计之初就融入了全栈式 NVIDIA 机密计算技术,旨在机架级规模上提供可信执行环境。Vera Rubin NVL72 将 Vera CPU、Rubin GPU、NVIDIA NVLink™ 网络以及安全功能整合为一个统一的平台,能够对高速互连链路中的数据进行加密。这提供了硬件级的远程证明,从而确保整个系统坚不可摧、无法被篡改。
包括 CoreWeave、Firmus、GMI Cloud、IBM Cloud、IREN、Lambda、Microsoft Azure、Nebius、Nscale、SpaceXAI 以及 Vultr 在内的云服务提供商正在采用 NVIDIA 机密计算技术。
要在 POD 级规模实现这种程度的安全防护,还需要一个可编程的软件层,在整个系统中执行、编排并动态调整安全策略。NVIDIA DOCA™ 软件平台为 AI 工厂中的每个 Vera Rubin 机架及各层级提供全面的高级安全防护,通过在 BlueField-4 芯片中强制执行各项安全能力,来保护数据、智能体、上下文记忆以及 AI 推理过程。
DOCA 支持多租户网络隔离、零信任策略执行、运行时威胁检测以及端到端加密能力,其处理速度高达 800Gb/s,且全程无需占用主机 CPU 资源,这让企业能够满怀信心的大规模扩展其 AI 工厂。
加速 AI 工厂建设与部署
NVIDIA DSX™ 平台为 Vera Rubin AI 工厂提供了完整的设计与运营基础 —— 它将参考设计、仿真、基础设施软件、配套设施以及生态系统技术融为一体,旨在帮助客户构建并运营高能效的 AI 工厂,并实现极致的单 Token 成本优化。
DSX 专为 Vera Rubin POD 架构打造,实现从芯片、系统到生命周期管理与多租户运营的全栈协同 —— 在大幅加速部署的同时,也为大规模运营的可靠性与韧性树立了全新行业标杆。
戴尔科技、HPE、联想与 Supermicro,以及华硕、Foxconn、技嘉、和硕、云达科技、纬创资通和纬颖等企业正在采用 NVIDIA DSX,以加速基于 Vera Rubin 的 AI 工厂快速投产。
上市时间
Vera Rubin 将于今年秋季正式启动量产并开始出货。
