新闻摘要:
- Rubin 平台采用软硬件极致协同设计,将推理 token 成本最多降低至 NVIDIA Blackwell 平台的十分之一,在 MoE 模型训练中使用的 GPU 数量仅为 Blackwell 平台的四分之一。
- NVIDIA Spectrum-X 以太网硅光交换机系统可将能效和持续运行时间提高 5 倍。
- 搭载 NVIDIA BlueField-4 存储处理器的全新 NVIDIA 推理上下文记忆存储平台加速代理式 AI 推理。
- 微软旗下搭载 NVIDIA Vera Rubin NVL72 机架级扩展系统的新一代 Fairwater AI 超级工厂,将扩展至搭载数十万个 NVIDIA Vera Rubin 超级芯片。
- CoreWeave 作为率先提供 NVIDIA Rubin 的首批企业之一,将通过 CoreWeave Mission Control 进行管理,兼顾灵活性和高性能。
- 扩大与红帽的合作,借助红帽企业 Linux、红帽 OpenShift 和红帽 AI,提供针对 Rubin 平台优化的完整 AI 堆栈。
CES – 太平洋时间 2026 年 1 月 5 日 – NVIDIA 今日发布 NVIDIA Rubin 平台,开启了新一代 AI 之旅,该平台由六款专为打造超凡 AI 超级计算机而设计的全新芯片组成。NVIDIA Rubin 树立了新的标杆,能以最低的成本构建、部署和安全运行全球最大型、最先进的 AI 系统,以助力加速主流 AI 的采用。
Rubin 平台对六款芯片——NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink™6 交换机、NVIDIA ConnectX® -9 SuperNIC、NVIDIA BlueField® -4 DPU 和 NVIDIA Spectrum™ -6 以太网交换机——进行极致协同设计,从而大幅缩短训练时间并降低推理 token 成本。
NVIDIA 创始人兼首席执行官黄仁勋表示:“训练和推理的 AI 计算需求不断激增,Rubin 的问世恰逢其时。凭借我们每年推出一代新 AI 超级计算机的节奏,以及对跨六款新芯片的极致协同设计,Rubin 朝着 AI 的新前沿迈出了关键一步。”
Rubin 平台以 Vera Florence Cooper Rubin 命名,这位具有开创精神的美国天文学家,她的发现改变了人类对宇宙的理解。Rubin 平台包括 NVIDIA Vera Rubin NVL72 机架级扩展解决方案和 NVIDIA HGX Rubin NVL8 系统。
Rubin 平台引入了五项创新技术,包括新一代 NVIDIA NVLink 互连技术、Transformer 引擎、机密计算和 RAS 引擎以及 NVIDIA Vera CPU。这些突破将以 NVIDIA Blackwell 平台低至十分之一的 token 成本加速代理式 AI、高级推理和超大规模混合专家 (MoE) 模型推理的发展。NVIDIA Rubin 平台在 MoE 模型训练中使用的 GPU 数量仅为前代平台的四分之一,从而可加速 AI 的采用与普及。
广泛的生态系统支持
预计采用 Rubin 的全球领先 AI 实验室、云服务提供商、计算机制造商和初创公司包括 Amazon Web Services (AWS)、Anthropic、Black Forest Labs、思科、Cohere、CoreWeave、Cursor、戴尔科技、Google、Harvey、HPE、Lambda、联想、Meta、微软、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、Oracle Cloud Infrastructure (OCI)、Perplexity、Runway、Supermicro、Thinking Machines Lab 和 xAI。
OpenAI 首席执行官 Sam Altman 表示:“智能随着算力而扩展。当我们增加算力时,模型就会变得更强,就能够解决更棘手的问题,并对人类产生更大的影响。NVIDIA Rubin 平台助力我们持续扩展这一进程,让先进智能惠及所有人。”
Anthropic 联合创始人兼首席执行官 Dario Amodei 表示:“NVIDIA Rubin 平台的效率提升代表了基础设施的重大进步,实现了更长的上下文记忆、更好的推理能力和更可靠的输出。与 NVIDIA 的合作为我们的安全研究和尖端模型赋能。”
Meta 创始人兼首席执行官马克·扎克伯格表示:”NVIDIA 的 Rubin 平台有望带来性能与效率的跃阶式提升,满足为数十亿用户部署先进模型的需求。”
xAI 创始人兼首席执行官埃隆·马斯克表示:“💚🎉🚀 🤖NVIDIA Rubin 将成为 AI 火箭的引擎。如果你需要大规模训练和部署尖端模型,这就是基础设施的不二之选——Rubin 会向世界重申 NVIDIA 是黄金标准。💚🎉🚀 🤖”
微软董事长兼首席执行官 Satya Nadella 表示:“我们正在打造全球最强大的 AI 超级工厂,以极致的性能和效率处理任意工作负载而不受地点限制。随着 NVIDIA Vera Rubin GPU 的加入,我们将为开发者和企业组织赋能,支持其以焕然一新的方式创作、推理和扩展。”
CoreWeave 联合创始人兼首席执行官 Mike Intrator 表示:“我们构建 CoreWeave 的目的就是用我们的定制 AI 平台为先行者提供卓越性能,在技术演进中为不同工作负载匹配适用的技术。NVIDIA Rubin 平台在推理、代理式 AI 和大规模推理工作负载方面实现了重大突破,我们期待将其纳入我们的平台。以 CoreWeave Mission Control 作为运营标准,通过与 NVIDIA 深度合作,我们可在高效整合新技术的同时保障生产级规模的稳定运行。”
AWS 首席执行官 Matt Garman 表示:“AWS 与 NVIDIA 携手推动云 AI 创新已 15 年有余。NVIDIA Rubin 平台登陆 AWS 标志着我们持续致力于提供尖端 AI 基础设施,为客户带来卓越的选项与灵活性。通过融合 NVIDIA 的先进 AI 技术与 AWS 久经验证的规模、安全性以及全面的 AI 服务,客户能以更高效率和更低成本构建、训练及部署要求最严苛的 AI 应用,从而加速实现从实验到任意规模量产的跨越。”
Google 和 Alphabet 首席执行官 Sundar Pichai 表示:“我们珍视与 NVIDIA 深厚而持久的合作关系。为满足客户对 NVIDIA GPU 的巨大需求,我们正着力在谷歌云上为其硬件打造最优运行环境。我们将持续深化合作,同时用 Rubin 平台的卓越能力赋能客户,为其提供突破 AI 边界所需的规模化性能。”
Oracle 首席执行官 Clay Magouyrk 表示:“Oracle Cloud Infrastructure 是专为极致性能打造的超大规模云平台。通过与 NVIDIA 的合作,我们正致力于拓展客户利用 AI 构建和扩展业务的疆界。借助由 NVIDIA Vera Rubin 架构驱动的 10 亿瓦级 AI 工厂,OCI 为客户提供推动模型训练、推理和对现实世界 AI 影响极限所需的基础设施。”
戴尔科技董事长兼首席执行官 Michael Dell 表示:“NVIDIA Rubin 平台代表着 AI 基础设施的重大飞跃。通过将 Rubin 集成到 Dell AI Factory with NVIDIA,我们正在构建能够处理海量 token 和多步骤推理的基础设施,同时提供企业和新型云服务商大规模部署 AI 所需的高性能和弹性。”
HPE 总裁兼首席执行官 Antonio Neri 表示:“AI 不仅在重塑工作负载,更是在重构 IT 基础架构,这要求我们对从网络到计算的每个基础设施的层级都进行重新构想。依托 NVIDIA Vera Rubin 平台,HPE 正在构建新一代安全的 AI 原生基础设施,将数据转化为智能,助力企业转型为真正的 AI 工厂。”
联想董事长兼首席执行官杨元庆表示:“联想计划采用新一代 NVIDIA Rubin 平台,结合我们的 Neptune 海神液冷解决方案以及我们在全球范围内的规模、制造效率与服务覆盖优势,助力企业构建作为智能加速引擎的 AI 工厂,加速洞察与创新。我们正共同架构 AI 赋能的未来,确保 AI 成为每一家企业组织的标配。”
专为扩展智能而设计
代理式 AI 和推理模型以及先进的视频生成工作负载正在重新定义计算的极限。多步骤问题解决需要模型具有跨长 token 序列进行处理、推理和采取行动的能力。专为复杂 AI 工作负载需求设计的 Rubin 平台采用了五项突破性技术,包括:
- 第六代 NVIDIA NVLink:提供当今大规模 MoE 模型所需的快速、无缝的 GPU 到 GPU 通信。每个 GPU 支持 3.6 TB/s 的带宽,每个 Vera Rubin NVL72 机架提供 260TB/s 的带宽,超过整个互联网的带宽总量。NVIDIA NVLink 6 交换机内置网络计算来加速集合运算,以及新功能以增强可维护性和可靠性,可实现更快、更高效的大规模 AI 训练和推理。
- NVIDIA Vera CPU:NVIDIA Vera 专为智能体推理而设计,是面向大规模 AI 工厂的能效最高的 CPU。这款 NVIDIA CPU 采用了 88 颗 NVIDIA 定制 OLYMPUS 核心打造,完全兼容 Armv9.2,并提供超高速 NVLink-C2C 连接能力。Vera 凭借卓越的性能、带宽和业界领先的能效,为各种现代数据中心工作负载提供支持。
- NVIDIA Rubin GPU:搭载具备硬件加速自适应压缩能力的第三代 Transformer 引擎,Rubin GPU 为 AI 推理提供 50 PFLOPS 的 NVFP4 运算能力。
- 第三代 NVIDIA 机密计算:Vera Rubin NVL72 是首个提供 NVIDIA 机密计算的机架级平台,能够在 CPU、GPU 和 NVLink 域之间的各个领域保障数据安全,从而保护全球最大规模的专有模型、训练和推理工作负载。
- 第二代 RAS 引擎:Rubin 平台涵盖 GPU、CPU 和 NVLink,具有实时运行状况检查、容错机制和主动维护等功能,能更大限度提升系统生产力。机架采用模块化无线缆托盘设计,装配和维护速度较 Blackwell 提升 18 倍。
AI 原生存储与安全软件定义基础设施
NVIDIA Rubin 推出 NVIDIA 推理上下文记忆存储平台,这是一种全新的 AI 原生存储基础设施,旨在实现超大规模推理上下文扩展。
该平台由 NVIDIA BlueField-4 提供支持,可在整个 AI 基础设施中高效共享和重复使用键值 (Key-Value) 缓存数据,提高响应速度和吞吐量,同时实现可预测、节能高效的代理式 AI 扩展。
随着 AI 工厂越来越多地采用裸金属和多租户部署模式,保持强大的基础设施控制和隔离变得至关重要。
BlueField-4 引入了高级安全可信资源架构 (ASTRA),这是一种系统级信任架构,为 AI 基础设施构建者提供了一个单一的、可信的控制点,以便在不影响性能的情况下安全地调配、隔离和运行大规模 AI 环境。
随着 AI 应用向多轮智能体推理的演进,AI 原生企业必须管理和共享跨用户、会话和服务的大量推理上下文。
不同形式针对不同工作负载
NVIDIA Vera Rubin NVL72 提供了一个统一、安全的系统,集成 72 个 NVIDIA Rubin GPU、36 个 NVIDIA Vera CPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC 和 NVIDIA BlueField-4 DPU。
NVIDIA 还将推出 NVIDIA HGX Rubin NVL8 平台,这是一个通过 NVLink 将 8 个 Rubin GPU 互连的服务器主板,为基于 x86 的生成式 AI 平台提供支持。HGX Rubin NVL8 平台可加速 AI 和高性能计算工作负载的训练、推理和科学计算。
NVIDIA DGX SuperPOD™ 可作为大规模部署基于 Rubin 的系统的参考架构,它集成了 NVIDIA DGX Vera Rubin NVL72 或 DGX Rubin NVL8 系统、NVIDIA BlueField-4 DPU、NVIDIA ConnectX-9 SuperNIC、NVIDIA InfiniBand 网络和 NVIDIA Mission Control™ 软件。
新一代以太网网络
先进的以太网网络和存储是 AI 基础设施的重要组成部分,对于确保数据中心全速运行、提高性能和效率以及降低成本至关重要。
NVIDIA Spectrum-6 以太网是用于 AI 网络的新一代以太网,旨在以更高的效率和更高的可靠性扩展基于 Rubin 的 AI 工厂,其支持 200G SerDes、光电一体化封装以及 AI 优化的网络技术。
基于 Spectrum-6 架构构建,Spectrum-X 以太网光电一体封装硅光交换机系统为 AI 应用提供 10 倍的可靠性和 5 倍的持续运行时间,并实现 5 倍的能效提升,与传统技术相比,可更大限度地提高每瓦性能。作为 Spectrum-X 以太网平台的一部分,Spectrum-XGS 以太网技术将相距数百公里及以上的多个基础设施连接在一起,作为单个统一的 AI 环境运行作业。
这些创新共同定义了新一代 NVIDIA Spectrum-X 以太网平台,为 Rubin 实现极致的工程协同设计,以驱动大规模 AI 工厂,并为未来百万 GPU 环境铺平道路。
Rubin 供应情况
NVIDIA Rubin 现已全面量产,基于 Rubin 的产品将在 2026 年下半年通过合作伙伴提供。
2026 年首批部署基于 Vera Rubin 实例的云提供商包括 AWS、Google Cloud、微软和 OCI 以及 NVIDIA 云合作伙伴 CoreWeave、Lambda、Nebius 和 Nscale。
微软将部署 NVIDIA Vera Rubin NVL72 机架级扩展系统,作为其新一代 AI 数据中心 (包括未来的 Fairwater AI 超级工厂基地) 的一部分。
Rubin 平台旨在为训练和推理工作负载提供前所未有的效率和性能,因此它将为微软旗下的新一代云 AI 能力提供基础。Microsoft Azure 将推出经过严格优化的平台,助力客户能够加速企业、研究和消费应领域的创新。
CoreWeave 将从 2026 年下半年开始,将基于 NVIDIA Rubin 的系统集成至其 AI 云平台中。CoreWeave 专为多架构并行运行打造,因此客户能够将 Rubin 部署至其环境,用于提升训练、推理和代理式工作负载方面。
CoreWeave 将与 NVIDIA 合作,帮助 AI 先行者利用 Rubin 在推理和 MoE 模型方面的突破,同时通过 CoreWeave Mission Control 在整个生命周期中继续提供生产级 AI 所需的性能、运行可靠性和扩展性。
此外,思科、戴尔、HPE、联想和 Supermicro 预计将推出基于 Rubin 产品的各种服务器。
Anthropic、Black Forest、Cohere、Cursor、Harvey、Meta、Mistral AI、OpenAI、OpenEvidence、Perplexity、Runway、Thinking Machines Lab 和 xAI 等 AI 实验室都在寻求借助 NVIDIA Rubin 平台来训练更大、功能更强的模型,并以比之前几代 GPU 更低的延迟和成本来为长上下文、多模态系统提供服务。
基础设施软件和存储合作伙伴 AIC、Canonical、Cloudian、DDN、戴尔、HPE、Hitachi Vantara、IBM、NetApp、Nutanix、Pure Storage、Supermicro、SUSE、VAST Data 和 WEKA 正在与 NVIDIA 合作,为 Rubin 基础设施设计新一代平台。
Rubin 平台标志着 NVIDIA 第三代机架扩展级架构的问世,目前已有 80 多家 NVIDIA MGX™ 生态系统合作伙伴。
为了释放这种密度优势,红帽今日宣布扩大与 NVIDIA 的合作,借助红帽的混合云系列产品,包括红帽企业 Linux、红帽 OpenShift 和红帽 AI,提供针对 NVIDIA Rubin 平台优化的完整 AI 堆栈。绝大多数《财富》全球 500 强企业都在使用这些解决方案。
了解更多信息,请观看 NVIDIA 在 CES 的直播回放并阅读 “Inside Vera Rubin” 技术博客。
关于 NVIDIA
NVIDIA(NASDAQ: NVDA)是 AI 和加速计算领域的全球领导者。
该新闻稿所含若干陈述包括(但不限于)有关以下各项的陈述:Rubin 的问世恰逢其时;我们每年推出一代新 AI 超级计算机——以及对横跨六款全新芯片的极致协同设计;Rubin 朝着 AI 的新前沿迈出了巨大跃进;NVIDIA 产品、服务及技术的效益、影响、性能与可用性;对 NVIDIA 与第三方(包括其合作者和合作伙伴)安排的预期;对技术发展及相关趋势和驱动因素的预期;其他非历史事实的陈述均属前瞻性陈述,这些都是符合 1933 年《证券法》第 27A 条(经修订)和 1934 年《证券交易法》第 21E 条(经修订)所定义的前瞻性声明。前瞻性声明受到这些法律条款创建的“安全港”保护,受制于可能导致结果与预期有重大差异的风险和不确定因素。可能导致实际结果产生重大差异的重要因素包括:全球经济状况;我们依靠第三方来制造、组装、包装和测试我们的产品;技术发展和竞争的影响;新产品和技术的开发或者现有产品升级;我们产品或合作伙伴产品的市场认可度;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和接口变化;我们产品或技术在集成到系统中时发生的意外性能损失;NVIDIA 向美国证券交易委员会(SEC)提交最新报告中不时详述的其他因素,这些报告包括(但不限于)采用 10-K 表的年度报告和采用 10-Q 表的季度报告。向 SEC 提交的报告的副本均在 NVIDIA 的官方网站上发布,并可免费下载。以上前瞻性陈述并非未来表现的保证,仅以本协议日期为准;除法律要求外,NVIDIA 不承担更新以上前瞻性陈述以反映未来事件或情况的任何义务。
本文所述的许多产品和功能仍处于不同的阶段,并将在可用时提供。上述声明不构成任何承诺、保证或法律义务,亦不应被解释为上述内容。本文所述的任何产品中描述的任何特性或功能的开发、发布和时间可能会发生变化,并由 NVIDIA 自行决定。对于未能交付或延迟交付本文所述的任何产品、特性或功能,NVIDIA 不承担任何责任。
© 2026 NVIDIA Corporation 保留一切权利。NVIDIA、NVIDIA 商标、BlueField、ConnectX、NVIDIA DGX SuperPOD、NVIDIA MGX、NVIDIA Mission Control、NVIDIA Spectrum、NVIDIA Spectrum-X 和 NVLink 均为 NVIDIA Corporation 在美国和/或其他国家的商标和/或注册商标。其他公司和产品名称可能是与其相关的各家公司的商标。功能、价格、可用性和规格如有更改,恕不另行通知。
