借助 NVIDIA Vera Rubin 平台,代理式 AI 推理的每 Token 成本降低至原来的十分之一。运行在 NVIDIA Vera 的智能体沙盒,相比于在传统 CPU 上的运行速度提高了 50% —— 而采用 Vera CPU 后,企业数据查询速度提升了 3 倍。包括礼来、三星和霍尼韦尔在内的 5,000 家企业,正在使用 Dell AI Factory with NVIDIA 运行 AI 工作负载,将技术愿景转化为大规模生产。
这就是 Michael Dell 在周一上午的戴尔科技全球峰会 (Dell Technologies World) 上描绘的画面。Michael Dell 评估了这一规模:到 2030 年,全球 AI 基础设施支出可能达到 3 至 4 万亿美元,而同一时期 Token 消耗量预计将增长 3400%。
Michael Dell 表示:“一场大规模的 AI 投资热潮已经拉开序幕,生产力热潮也正在开启,包括我们公司在内的一些公司已经开始行动。变化的速度呈抛物线式增长,而且没有放缓的迹象。”
随后,戴尔董事长兼首席执行官邀请 NVIDIA 创始人兼首席执行官黄仁勋登上主题演讲的舞台 —— 并展示了他身后的 NVIDIA 产品组合,从配备 GB10 工作站的台式机 Dell Pro Max 到搭载 NVIDIA Vera Rubin 平台的 Dell PowerRack。
黄仁勋表示:“我们现在已经进入实用 AI 时代,这就是需求正呈抛物线式、甚至是完全抛物线式增长的原因。过去需要几个月的时间才能完成的工作,现在只需要数周时间就能完成;过去需要几周的,现在只需几天;而过去需要几天的,现在只需几个小时。这是生产力的巨大飞跃,但同时也对计算需求提出了极高的要求。”
其传递的信息是:企业级 AI 已从试点阶段发展到代理式 AI 和大规模推理部署阶段。而承载这一未来的平台就是 Dell AI Factory with NVIDIA —— 它能够在企业边界内,安全运行前沿模型和自主智能体。
面向代理时代的新型 AI 工厂
全新 Dell PowerSwitch 系列还搭载 NVIDIA Quantum-X800 InfiniBand 网络,采用液冷一体封装的光学元件和 NVIDIA Spectrum-6 以太网。
戴尔还推出了 Dell PowerRack,这是一套将计算、网络和存储融为一体的完全集成系统,其散热设计、电源管理和软件优化从底层开始便为协同工作而构建。其结果是在企业规模上实现了 AI 和高性能计算工作负载的加速,无需组件组装的集成开销。
在 CPU 方面,Dell PowerEdge M9822 和 R9822 服务器将 NVIDIA Vera CPU 引入企业级 AI 工厂。Vera 专为代理式 AI 打造,可运行数据管线、分析、沙盒工具和代码工作负载,其中每个步骤都顺序进行。
凭借高达 1.2 TB/s 的内存带宽以及在负载下可预测的性能,与 x86 处理器相比,Vera 可将代理式工作负载的处理速度提升 50%,帮助 PowerEdge 系统通过更快的智能体响应和更短的反馈循环来提高 AI 工厂的产出。
黄仁勋表示:“Vera CPU 的单线程性能相较全球任何一款 CPU 具有较强表现力。它的内存带宽是其他 CPU 的三倍 —— 因此 Starburst、DuckDB 等数据库运行速度都非常快,因为智能体需要频繁访问数据库,所以 CPU 必须足够快。”
Starburst 是 Dell AI Data Platform with NVIDIA 中的新型数据引擎,在 NVIDIA Vera CPU 上可将查询吞吐量提升至原来的 3 倍,以实现大规模 SQL 分析。
企业数据为 AI 工厂提供动力。戴尔更新 Dell AI Data Platform with NVIDIA,其核心是基于 NVIDIA CUDA-X 库所构建的加速数据引擎 —— 包括用于结构化数据的 cuDF 和用于非结构化数据的 cuVS。
主题演讲中还介绍了多家使用 Dell AI Factory with NVIDIA 的客户。
礼来公司执行副总裁兼首席信息和数字官 Diogo Rau 在主题演讲前半段登台 —— 讨论了礼来在生命科学领域由 AI 驱动的进步和创新,这些成就由与戴尔和 NVIDIA 合作大规模部署的 AI 基础设施提供支持。
他将技术描述为实现大规模尖端科学的关键。Rau 表示:“我认为我们可能即将终结我们所知的疾病。这样的事情在 20 年前是完全无法想象的,但如今,我们已经可以想象到了。”
随后现场播放了来自三星的视频 —— 重点介绍了在 Dell AI Factory with NVIDIA 上运行的研发芯片设计和制造用例。
霍尼韦尔首席技术官 Suresh Venkatarayalu 与 Michael Dell 一起介绍了该公司从公有云转向本地 AI 的过程 —— 即使用 Dell AI Factory 和 Dell AI Data Platform with NVIDIA 实现工业 AI 用例、数字孪生以及从数据中心到边缘的自动化。
Venkatarayalu 表示:“对我而言,与戴尔和 NVIDIA 合作不仅仅是为了获得基础设施。”他解释说,这是完整的 AI 堆栈:可扩展、安全且受到客户信任。
在金融服务领域,算法交易公司 Hudson River Trading 正在扩大其戴尔设备的部署,以支持 AI 驱动的研究,运行 Dell PowerEdge XE9685L 服务器,并使用 NVIDIA 加速计算和 NVIDIA Spectrum-X 以太网以满足其数据、模型和业务扩展需求。
本地智能体和模型 —— 安全至上
从 Michael Dell 在主题演讲中引用的 AI 采用调查能够发现,目前 67% 的 AI 工作负载在云外运行 —— 包括本地、设备端、边缘或托管环境 —— 且 88% 的受访者至少在本地运行一个 AI 工作负载。
本地 AI 的发布回答了 Michael Dell 直接向全场提出的一个问题:“如何将出色的 AI 模型部署在你需要的地方,并同时内置安全和治理功能?”
答案在于 NVIDIA 机密计算 —— 与 Fortanix、Google、红帽和其他合作伙伴共同提供 —— 作为在企业内部安全部署前沿模型的基础,而确保模型 IP 或数据不会被泄露。
这使企业能够保护正在使用的 AI 模型和敏感数据,同时充分利用本地 AI 基础设施在 Token 效率、性能和成本方面的优势。
受机密计算保护的前沿专有模型
通过 NVIDIA Blackwell 加速并由 NVIDIA 机密计算保护,内置 Gemini 3.0 的 Google Distributed Cloud (GDC) 现已在 Dell PowerEdge XE9780 服务器上提供预览版 —— 为企业提供用于高级 AI 的私有机密计算环境。
SpaceXAI 也将把最新的本地 SpaceXAI 模型引入 Dell AI Factory,NVIDIA 机密计算将端到端保护模型权重和企业数据。
在 Dell AI Factory 上原生运行的开放前沿模型
NVIDIA Nemotron 模型 —— 前沿级开放智能 —— 在 Dell AI Factory 基础设施上运行,适用于希望根据自身领域和数据微调开放权重模型的企业。
Reflection 的开源前沿 AI 模型也即将支持本地部署,专为受监管行业、政府和主权实体打造。
其他开放模型 —— MiniMax-M2.7、DeepSeek Pro、DeepSeek-V4、GLM 5.1 和经过 NVIDIA NVFP4 优化的 Kimi K2.6 —— 现可在 Hugging Face 的 Dell Enterprise Hub 上获取,与 Gemma 4、NVIDIA Nemotron Super 3、Mistral Small 4 和 Arcee Trinity-Large-Thinking 同步上线。
在这个全新的代理时代,企业还需要智能体在混合和本地环境中安全地工作,而这些环境中已经存在数据、系统和工作流。
OpenAI Codex 将连接 Dell AI Data Platform,以帮助客户将 Codex 更贴近使智能体发挥作用的内部上下文,包括代码库、文档、业务系统、运营知识和团队工作流。戴尔和 OpenAI 还将探索 Codex 如何与 Dell AI Factory 连接。
软件合作伙伴生态系统
戴尔宣布了多项新的软件合作关系,涵盖代理式 AI、代码助手和计算机视觉等常见企业 AI 用例。
其中包括 3 月发布的 Palantir 与 NVIDIA 合作开发的主权 AI 操作系统参考架构,该架构现已在戴尔基础设施上运行 —— 用于在本地部署 Palantir Ontology 和 AIP,并与 NVIDIA 主权 AI 操作系统参考架构集成。
此外,ServiceNow 客户将能够利用 Dell AI Factory 将基础设施和企业工作流自动化相结合,使组织能够发现、治理和运营专注于业务成果的 AI。
戴尔还宣布与众多 AI 领导者和软件创新者合作的全新解决方案,合作方包括 Fogsphere、Ipsotek、Mistral AI、Poolside 和 Uneeq,同时,戴尔还与 CrowdStrike 和 Fortanix 建立了安全领域合作伙伴关系。
从桌面到数据中心的智能体
最触手可及的消息则是:搭载 NVIDIA NemoClaw 软件堆栈、NVIDIA OpenShell 运行时和 NVIDIA Nemotron 开放模型的 Dell Deskside Agentic AI,现可在搭载 NVIDIA Grace Blackwell 架构的 Dell Pro Max (配备 GB10) 上运行,同时也可在搭载 NVIDIA RTX PRO 工作站的 Dell Pro Precision 系统上运行。
在定制化层面:NVIDIA Nemotron、NVIDIA Agent Toolkit 和 NVIDIA NemoClaw —— 黄仁勋在演讲中将其描述为本地模型与企业数据之间连接层的智能体编排工具 —— 为构建企业自主智能体提供了基础,使组织能够定制模型、编排智能体工作流,并使智能体安全地连接企业数据和工具。
在安全层面:NVIDIA OpenShell —— 一个用于开发和部署具有安全和隐私控制的自主智能体的开源运行时 —— 支持在基础设施层强制执行企业策略,并与领先的企业软件平台集成。
NVIDIA OpenShell 现已在整个 Dell AI Factory with NVIDIA 中得到支持,为开发者提供了一个安全的运行时,以便在从工作站到服务器的环境中构建、部署和治理 AI 智能体。
戴尔还强调了对 NVIDIA AI-Q Blueprint 的支持,为企业部署用于深度研究的多智能体工作流提供了参考示例 —— 加速从开发到试点再到生产的路径。
大会第二天
在戴尔科技全球峰会的第二天,戴尔首席运营官 Jeff Clarke 和基础设施解决方案集团总裁 Arthur Lewis 将深入介绍 NVIDIA Vera CPU、Vera Rubin、机密计算和 Nemotron —— 并现场演示 Dell Deskside Agentic AI。
黄仁勋和 Michael Dell 周一确立的主题 —— 安全、长时间运行的智能体、全栈工厂以及安全的本地部署 —— 为 NVIDIA 将于 6 月 1 日至 4 日 COMPUTEX 期间举办的 GTC 台北大会上带来的更广泛发布奠定了基础。
