COMPUTEX —— 2025 年 5 月 19 日 —— NVIDIA 今日宣布推出 AI 平台 NVIDIA DGX Cloud Lepton™,该平台拥有一个计算市场 (marketplace),可通过全球云提供商网络向构建代理式 AI 和物理 AI 应用的全球开发者提供数以万计的 GPU 资源。
为满足 AI 需求,包括 CoreWeave、Crusoe、Firmus、Foxconn、GMI Cloud、Lambda、Nebius、Nscale、SoftBank Corp. 和 Yotta Data Services 在内的 NVIDIA 云合作伙伴 (NCP) 将通过 DGX Cloud Lepton marketplace 提供 NVIDIA GPU。
开发者可以调用指定区域的 GPU 算力,并可进行按需计算和长期计算,从而满足战略级和主权 AI 的运营需求。预计领先的云服务提供商和 GPU marketplace 也将加入 DGX Cloud Lepton marketplace。
NVIDIA 创始人兼首席执行官黄仁勋表示:“NVIDIA DGX Cloud Lepton 会将我们的全球 GPU 云提供商网络与 AI 开发者连接起来。我们将与 NCP 协作,共同构建一个世界级的 AI 工厂。”
DGX Cloud Lepton 将通过整合 NVIDIA 计算生态系统内的云 AI 服务与 GPU 算力资源,应对保保障高性能 GPU 算力稳定供给的核心挑战。此外,该平台集成了 NVIDIA 软件栈,包括 NVIDIA NIM™ 和 NeMo™ 微服务、NVIDIA Blueprint 和 NVIDIA Cloud Functions,以加速并简化 AI 应用的开发和部署。
DGX Cloud Lepton 为云提供商提供了管理软件,可对 GPU 运行状况进行实时诊断并自动分析原因,进而减少人工操作并缩短宕机时间。
该平台的主要优势包括:
- 提高生产力和灵活性:提供统一的开发、训练和推理体验,帮助提高生产力。开发者可以通过 marketplace 直接向参与的云提供商购买 GPU 算力,也可以自带计算集群,从而获得更大的灵活性和控制能力。
- 无障碍部署:利用面向推理、测试和训练工作负载的集成式服务,以较小的操作成本跨多云和混合环境部署 AI 应用。
- 敏捷性和主权:允许开发者快速访问特定区域的 GPU 资源,遵循数据主权法规的同时满足敏感工作负载的低延迟要求。
- 可预测性能:为参与的云提供商提供企业级性能、可靠性和安全性,确保一致的用户体验。
AI 云性能的新标准
NVIDIA 今日还宣布推出 NVIDIA Exemplar Clouds,以使用 NVIDIA 的专业知识、参考硬件和软件、以及运营工具,帮助 NCP 提高安全性、可用性、性能和弹性。
NVIDIA Exemplar Clouds 将利用 NVIDIA DGX™ Cloud Benchmarking 这一整套工具和方案,用于优化 AI 平台上的工作负载性能,并对成本与性能之间的关系进行量化。
Yotta Data Services 是亚太地区首家加入 NVIDIA Exemplar Cloud 计划的 NCP。
可用性
开发者可进行注册,抢先体验 NVIDIA DGX Cloud Lepton。
观看黄仁勋的 COMPUTEX 主题演讲,了解更多 NVIDIA GTC 台北大会详情。