NVIDIA 与合作伙伴推动基于 Vera Rubin 的新一代高效吉瓦级 AI 工厂建设

20 多家公司将加入 NVIDIA 不断壮大的合作伙伴生态系统,共同支持 800 伏直流数据中心,以实现未来的吉瓦级 AI 工厂。
作者 Harry Petty

在 OCP 全球峰会上,NVIDIA 展示了吉瓦级 AI 工厂的未来蓝图。

NVIDIA 公布了 50 余家 MGX 合作伙伴生态系统将支持 NVIDIA Kyber,Kyber 旨在满足日益增长的推理需求。

20 余家行业合作伙伴展示了面向吉瓦时代的新一代 800 伏直流数据中心的新型芯片、组件、电源系统和相关支持技术,它们均支持 NVIDIA Kyber 机架架构。

Foxconn 详细介绍了其正在中国台湾地区建设的 40 兆瓦高雄 K-1 数据中心,该数据中心专为 800 伏直流技术而设计。CoreWeave、Lambda、Nebius、Oracle Cloud Infrastructure 和 Together AI 等行业领导者也在设计 800 伏数据中心。此外,维谛技术还发布了其节省空间、成本和能源的 800 伏直流 MGX 参考架构,这是一套完整的电源和冷却基础设施架构。HPE 宣布其产品将支持 NVIDIA Kyber 以及 NVIDIA Spectrum-XGS 以太网 (Spectrum-X 以太网网络平台的一部分) 跨区域扩展技术。

相较于传统的 415 伏或 480 伏三相交流系统,800 伏直流基础设施不仅能提升数据中心的可扩展性和能效,还能减少材料使用量,并提高性能承载能力。电动汽车和太阳能行业已经采用了 800 伏直流基础设施,均实现了以上好处。

开放计算项目 (OCP) 由 Meta 公司发起,它是一个由数百家计算和网络提供商组成的行业联盟,致力于重新设计硬件技术,以高效地满足对计算基础设施日益增长的需求。

NVIDIA Kyber 机架服务器时代

OCP 生态系统也在为 NVIDIA Kyber 积极地做准备,该系列在 800 伏直流供电、液冷和机械设计方面实现了多项创新突破。

这些技术创新将助力机架服务器迈入 NVIDIA Kyber 时代。该系列将是一个高密度平台,将于 2027 年推出。

应对高功率配电挑战的最有效方法是提高电压。从传统的 415 伏或 480 伏三相交流系统转向 800 伏直流架构,可带来多方面的好处。

当前的转型使机架服务器合作伙伴能将机架内组件从 54 伏直流电升级到 800 伏直流电,以获得更好的效果。此次峰会上,直流电基础设施提供商、电源系统及冷却合作伙伴、芯片制造商等生态伙伴齐聚一堂,均支持 MGX 机架服务器参考架构的开放标准。

NVIDIA Kyber 旨在面向大规模 AI 基础设施来提升机架内的 GPU 密度、纵向扩展网络规模,并最大限度提升性能。通过将计算刀片像书架上的书籍一样垂直排列,Kyber 可以使每个机箱容纳多达 18 个计算刀片,并通过零线缆的中板和定制化的 NVIDIA NVLink 交换刀片从后面集成在一起,实现无缝的网络纵向扩展。

在 800 伏直流技术支持下,相同的铜缆传输功率提高了 150% 以上,无需再使用 200 千克重的铜总线架为单个机架供电。

Kyber 将成为超大规模 AI 数据中心的基础组件,在未来几年可为最先进的生成式 AI 工作负载提供卓越的性能、能效和可靠性。NVIDIA Kyber 机架能帮助客户减少数吨铜的使用量,从而节省数百万美元成本。

NVIDIA NVLink Fusion 生态系统持续拓展

除硬件外,NVIDIA NVLink Fusion 也在稳步发展,企业将其半定制的芯片无缝集成到高度优化且广泛应用的数据中心架构中,从而降低复杂度并加速产品上市时间。

英特尔和 Samsung Foundry ‌已加入 NVLink Fusion 生态系统,该生态系统包括定制芯片设计商、CPU 及 IP 合作伙伴等,旨在帮助 AI 工厂快速扩展,以应对模型训练和代理式 AI 推理等要求苛刻的工作负载。

  • 作为 NVIDIA 与英特尔近期宣布的合作内容之一,英特尔将制造可通过 NVLink Fusion 集成到 NVIDIA 基础设施平台的 x86 CPU。
  • Samsung Foundry‌已与 NVIDIA 合作,以满足市场对定制 CPU 和定制 XPU 不断增长的需求,为定制芯片提供从设计到制造的全流程服务。

开放生态系统的力量:推动下一代 AI 工厂的规模化发展

超过 20 家 NVIDIA 合作伙伴正帮助提供符合开放式标准的机架式服务器,助力实现未来的吉瓦级 AI 工厂。

了解更多有关 NVIDIA 与开放计算项目的信息,请访问:https://www.nvidia.com/en-us/events/ocp-summit/