NVIDIA AI 云生态系统在全球范围内扩展,以满足全球 AI 计算需求

快速发展的生态系统助力企业、初创公司、国家、AI 实验室和开发者扩展代理式 AI 应用。
作者

NVIDIA AI 云生态系统正在加速全球 AI 工厂基础设施的建设。合作伙伴正在扩大产能,以满足企业、初创公司、国家、AI 实验室和开发者对代理式 AI 应用不断增长的需求。

NVIDIA AI 云是一个不断发展的专用云生态系统,可满足当今热门 AI 应用对 Token 的爆炸式需求。这些 AI 云与 NVIDIA 的全栈 AI 基础设施协同设计,以满足企业、初创公司和国家/地区对新供应商和区域产能日益增长的需求。

它们结合了 NVIDIA 加速计算、网络和 AI 软件,助力合作伙伴支持训练、微调、推理、代理式 AI、物理 AI 和主权 AI 部署。具体配置因合作伙伴和工作负载而异。

AI 云合作伙伴选择 NVIDIA,旨在获得极佳的经济效益 —— 包括极低的 Token 成本和卓越的每瓦吞吐量 —— 以运行前沿和开源 AI。这些云基于 NVIDIA 加速计算、网络和 AI 软件构建,使 AI 工厂更贴近数据、开发者、用户和行业,帮助客户大规模训练、调优和运行代理式 AI 应用。该生态系统几乎覆盖所有地理区域,为前沿模型构建者、企业、初创公司、软件提供商和国家 AI 计划提供区域和主权 AI 能力支持。

NVIDIA 创始人兼首席执行官黄仁勋表示:“每个公司和每个国家都需要 AI 工厂基础设施,将数据转化为智能。NVIDIA AI 云使全栈 AI 工厂更贴近那些正在构建下一代 AI 的地区、行业和开发者,从模型训练到实时推理和 AI 智能体,这些都将改变人们与组织的工作方式。”

广泛的 AI 云生态系统

从 AI 云提供商、电信公司、主权 AI 构建者到垂直集成的基础设施提供商,各方正在与 NVIDIA 共同构建 AI 工厂,为前沿 AI、企业级 AI、电信、开发者云和国家 AI 计划等领域的客户提供服务。

在东南亚、澳大利亚和美洲的区域增长正加速拓展,随着非洲的 Cassava 和南美洲的 Claro 的加入,NVIDIA AI 云现已覆盖六大洲。

NVIDIA AI 云正在将大规模 AI 工厂建设与领先的 AI 实验室、企业、政府和数字服务提供商的需求相结合。包括 CoreWeave、Firmus、IREN 和 Nscale 在内的合作伙伴正在扩展 AI 基础设施,以支持前沿模型开发、企业级 AI、代理式应用和高并发推理。

在各个地区,NVIDIA AI 云正在将 AI 工厂带到更贴近本地产业和主权 AI 生态系统的地方。包括 Firebird、GMI Cloud、Indosat Ooredoo Hutchison、Lambda、Naver Cloud、Sharon AI、Yotta 和 YTL 在内的合作伙伴正在支持新兴 AI 公司、国家 AI 计划、金融服务、电信、制造、教育、医疗和开发者生态系统。

对于政府和受监管的行业,区域 AI 云能够支持主权管理和本地合规要求。对于开发者和企业而言,可以降低获取加速基础设施的门槛,以用于支持 AI 智能体、企业 Copilot、数字员工和其他必须靠近用户和数据运行的 AI 服务。

Firmus 在澳大利亚和亚太地区扩展 AI 工厂版图

Firmus Technologies 正在南澳大利亚和东南亚地区扩展其 AI 工厂版图,构建高能效基础设施,以支持对大规模训练、推理和代理式 AI 工作负载日益增长的需求。

通过 Southgate 项目,Firmus 正在塔斯马尼亚、墨尔本、南澳大利亚和新南威尔士州开发 AI 工厂,重点采用可再生能源、先进冷却技术和模块化基础设施,以更快地上线产能。该公司还通过与 ST Telemedia Global Data Centres 的合作,在新加坡部署了 AI 基础设施。

Firmus 在其建设中使用了 NVIDIA 的加速计算和参考架构,其中 NVIDIA DSX 帮助简化了 AI 工厂的设计、部署和运营。

液冷 Firmus HyperCube 的设计与 NVIDIA DSX 平台相一致,旨在加速模块化 AI 工厂的构建,并以降低每 Token 成本为目标优化。Firmus 正在整个 AI 工厂供应链的冷却和能源等环节进行创新。

Firmus 联合首席执行官 Tim Rosenfield 表示:“AI 智能体正在创造一种全新的工业级 Token 需求,亚太地区需要能够更快构建、更高效液冷并以十亿瓦级规模运营的 AI 工厂。Firmus 正与 NVIDIA 携手构建液冷 AI 基础设施,旨在为该地区的重要客户尽可能高效、快速地提供 AI Token。”

CoreWeave 推动物理 AI 和新一代 AI 工厂的发展

CoreWeave 正在扩展其 NVIDIA AI 云平台,以支持下一波代理式 AI、物理 AI 和前沿模型工作负载。

CoreWeave 作为 NVIDIA Vera Rubin 和 NVIDIA Vera CPU 的早期采用者,同时也是首批采用 NVIDIA Spectrum-X 以太网光子技术的公司之一,为百万级 GPU AI 工厂提供网络基础。CoreWeave 正在扩展其面向机器人和物理 AI 工作流的平台,包括使用最新的前沿世界基础模型 NVIDIA Cosmos 3,以帮助团队生成合成数据、微调模型并加速机器人数据飞轮。

CoreWeave 联合创始人、董事长兼首席执行官 Michael Intrator 表示:“AI 工厂正在成为智能体时代的基础。CoreWeave 正与 NVIDIA 携手构建全栈云基础设施,为 AI 实验室、企业和开发者提供所需的性能、规模和可靠性,从而将前沿模型、AI 智能体和物理 AI 系统转化为生产应用。”

Nebius 为智能体工作流构建开放式物理 AI Workbench

Nebius 正在扩展其 NVIDIA AI 云,以为训练、推理和物理 AI 开发提供全栈平台。

作为 NVIDIA Vera Rubin 的早期采用者,Nebius 正在构建从芯片到软件的一体化 AI 基础设施,包括 Nebius AI 云、Token Factory 推理层及全新的物理 AI Workbench。该工作台将 NVIDIA Cosmos 3、NVIDIA Isaac Sim 和 Isaac GR00T 等技术整合进可由 AI 智能体组装的组合式工作流中,帮助机器人和自主系统团队更快地从仿真和合成数据转向训练和评估。

Nebius 创始人兼首席执行官 Arkady Volozh 表示:“开发者应该能够在无需花费数周时间来连接基础设施的条件下去构建 AI 系统。通过与 NVIDIA 合作,Nebius 正在创建一个 AI 云,AI 智能体可以在其中组合所需的工具、数据和计算以加速 AI 工作负载 —— 从机器人、生命科学到企业等领域 —— 从实验阶段快速走向生产阶段。”

NVIDIA Exemplar Cloud 势头强劲

自 NVIDIA 去年推出 Exemplar Cloud 以来,已有六家 NVIDIA 云合作伙伴获得 Exemplar Cloud 认证:CoreWeave、Crusoe、Lambda、Nebius、Vultr 和 YTL。不断增加的名单反映了对能够为生产型 AI 工作负载提供一致的性能、可靠性和效率的 AI 云基础设施日益增长的需求。

这些提供商正在帮助提高整个 AI 云生态系统的性能标准,为企业、开发者和 AI 实验室提供更多经过验证的选项,以扩展训练、推理和代理式 AI 服务。

专为 AI 工厂经济设计

随着 AI 从模型开发转向推理和大规模推理,基础设施的衡量标准不再仅仅是公布的产能,还包括由平台利用率、正常运行时间、资产的长期寿命以及人们可以投入使用的有用 AI 智能体的广度和深度驱动的 Token 输出的经济效益。

基于 NVIDIA 全栈 AI 工厂平台构建的 AI 云可帮助合作伙伴针对这些指标优化基础设施。

每 Token 成本是衡量总拥有成本的指标,直接涵盖硬件性能、软件优化、生态系统支持和实际利用率。凭借实际交付的 Token 吞吐量、软件优化以及跨计算、网络、内存和存储的全栈协同设计,NVIDIA 提供业内极低的每 Token 成本

DSX 助力 AI 云更快上线产能

NVIDIA AI 云正在采用 NVIDIA DSX 平台设计、构建和运营 AI 工厂。

DSX 集成了经过验证的参考设计、仿真、软件和生态系统技术,帮助云提供商更快地上线产能、更高效地运营并实现收入最大化。

DSX Sim 帮助团队在部署前对 AI 工厂进行建模和验证。DSX Flex 帮助 AI 工厂根据电网条件动态调整工作负载。DSX MaxLPS 帮助受限于功耗的 AI 工厂在固定的功耗预算内实现计算能力最大化,使 GPU 的部署数量提升高达 40%。DSX OS 有助于大规模自动化生命周期管理和运营。

DSX 帮助 AI 云降低部署风险、提高弹性、提升每瓦 Token 产出并实现极低的每 Token 成本。