代理式 AI 的时代已经到来,但要兑现潜力,需要的不仅是好模型,还需要高性能硬件、安全的运行时、响应迅速的数据层以及针对长时间运行推理而调优的模型。NVIDIA 和微软正在将这一全栈技术带给在 Windows 设备、Azure 云和本地部署的开发者。
在 Microsoft Build 大会上,NVIDIA 创始人兼首席执行官黄仁勋通过直播连线的方式加入微软董事长兼首席执行官 Satya Nadella 的主题演讲,讨论双方扩展的合作伙伴关系:NVIDIA RTX Spark 以及适用于 Windows 的 DGX Station ,NVIDIA GPU 加速的 Microsoft Fabric、Microsoft Foundry 上的 NVIDIA 开放模型、GitHub Copilot 中的 NVIDIA OpenShell 提供的安全运行时和新一代 NVIDIA 驱动的 AI 工厂。
为智能体重塑 Windows:从 RTX Spark 到适用于 Windows 的 DGX Station
NVIDIA 和微软正在为 AI 智能体时代重新构想 Windows PC。借助 RTX Spark 笔记本电脑和小型桌面主机,以及适用于 Windows 台式 AI 超级计算机的 DGX Station,开发者可以在 Windows 上本地构建、微调和运行智能体。

RTX Spark 是新的开始,为全球首款专为个人智能体打造的 Windows PC 提供动力,不仅拥有高达 1 PetaFLOP AI 性能和 128GB 统一内存,全天续航,还能在不外接供电的情况下仍能提供强大的 AI 和图形性能。将 NVIDIA 30 年的技术创新,包括:CUDA、RTX、DLSS 和 TensorRT,带到微软 Surface、华硕、戴尔、惠普、联想和微星等将在今年秋季发布的产品上。
适用于 Windows 的 DGX Station 是功能强大的桌面 AI 超级计算机,用于在 Windows 企业级应用和工作流中构建和运行智能体。该平台由 NVIDIA Grace Blackwell Ultra 桌面超级芯片提供支持,具有高达 748GB 的统一内存和 20 PetaFLOPS 的 FP4 性能,可运行高达 1 万亿参数的前沿模型,用于全天运行的企业智能体。预计华硕、戴尔、技嘉、惠普、微星和 Supermicro 将在第四季度推出各自的系统。这两款产品均运行 NVIDIA OpenShell,这是一款专为自主智能体设计的安全运行时。
阅读此 Microsoft 博客了解更多内容。
在 Microsoft Foundry 上使用 NVIDIA 开放模型实现企业级智能体工作流

代理式 AI 在模型系统上运行。现在,在 Foundry Agent Service 中托管的智能体中,企业可以使用 NVIDIA、Anthropic 和 OpenAI 模型以及 Hermes 特殊智能体,在 Azure 上实现具有内置身份和治理的智能体系统。Anthropic 的 Claude 模型现已在 Azure 上的 NVIDIA Grace Blackwell Ultra 系统上原生运行,并将在未来几周内向客户提供。
NVIDIA Nemotron 3 Ultra 是一个全新开放前沿推理模型,适用于跨编码、研究和企业工作流的长时间运行智能体,该模型与用于语音识别的 Nemotron 3.5 ASR 和 Nemotron 3.5 Content Safety,将于本月在 Foundry 托管计算上推出。开发者可以将 Nemotron 与前沿模型和本地模型结合使用,从而优化每个工作流的成本和质量。
NVIDIA 在 Foundry 上的开放模型组合现已涵盖代理式 AI、物理 AI 和科学 AI。NVIDIA Cosmos 3 是首个完全开放的物理 AI 全模态模型,可实现视觉推理、世界仿真和动作生成。NVIDIA Earth-2 AI 天气模型可通过 Microsoft Planetary Computer Pro 和 Foundry 进行企业预测和风险分析。
NVIDIA Agent Toolkit 以及 NVIDIA NemoClaw 蓝图为开发者提供了一个开源平台,以便在 Foundry 上构建生产级智能体。包括 cuDF、cuOpt、AI-Q 和 NeMo 在内的 NVIDIA CUDA-X 库现在可作为特定领域技能供智能体使用。
观看此分组会议回放了解详情:“在 Microsoft Foundry 上使用 NVIDIA Nemotron 模型编排特殊智能体”。
为 AI 时代加速企业数据仓库
数据是代理式 AI 的燃料,因此快速访问数据至关重要。
NVIDIA 加速计算现已内置于 Microsoft Fabric 数据仓库中,根据 Microsoft 的内部基准测试,与 CPU 驱动的基线相比,SQL 执行速度可提升至原来的 6 倍。在处理高并发工作负载方面,与其他三家领先的云数据仓库提供商相比,SQL 执行速度可提升至原来的 7 倍。
企业数据层现在可以与 AI 智能体保持同步,这些智能体会持续查询数据并进行推理,这是 NVIDIA 和 Microsoft 多年来从研究到生产进行深度工程协作的成果。
阅读此 Microsoft 博客了解更多内容。
推进物理 AI 和自主系统的发展
物理 AI 是智能体的下一个前沿领域。
Microsoft 正在集成面向物理 AI 的 NVIDIA 的开源技能和工具与 Azure 及其物理 AI 工具链。开发者可获得由 Cosmos 3 的混合 Transformer 架构提供支持的统一平台,用于仿真、训练和部署自主系统,包括机器人、智能汽车和工业系统,这些系统能够在物理世界中感知、推理、规划和行动。在视觉推理、世界生成和动作生成等关键基准测试中,Cosmos 3 在开放模型中位居榜首。
借助 NVIDIA RTX PRO Blackwell 服务器版和 Nemotron 模型增强 Azure Local 和 Foundry Local
代理式 AI 正在超越云端。
微软正在将 Azure Local 上的 Foundry Local 引入 NVIDIA RTX PRO Blackwell 服务器版平台。企业可以借助 NVIDIA Nemotron 开放模型系列,在本地、混合或主权环境中运行高性能 AI 工作负载,而无需牺牲性能或治理。
Azure Local 上的 Foundry Local 现已支持多节点部署和 vLLM 运行时,可扩展制造、能源、主权数据中心和其他对延迟敏感的场景的推理能力。
阅读 Microsoft 博客 1 和 Microsoft 博客 2 了解更多内容。
借助 NVIDIA OpenShell 将安全的智能体开发引入 GitHub Copilot
随着智能体从编码辅助转向自主执行,它们需要真正的能力,而无需真实的凭证。
现已集成到 GitHub Copilot 中的 NVIDIA OpenShell 可解决这一问题:每个智能体都在自己的沙盒容器中独立运行,并且每个出站调用在访问文件、网络或凭证之前都要经过策略评估。策略以代码的形式编写,在存储库中版本化,并可随时更新。OpenShell 是基于 Apache 2.0 的开源软件,与模型无关,适用于本地、混合和云环境。
阅读此 Microsoft 博客了解更多内容。
Fairwater Wisconsin 上线,并已确认支持 NVIDIA Vera Rubin 平台

微软位于威斯康星州的 AI 工厂 Fairwater 已提前上线,作为一个 AI 工厂,运行数十万个 NVIDIA Grace Blackwell 系统,并与位于乔治亚州的另一个同类 AI 工厂互连,为需求严苛的前沿模型提供可扩展的分布式 AI 系统。通过在电力、冷却、NVIDIA Spectrum-X 以太网以及全新 MRC (多路径可靠连接) 传输协议上的联合工程,微软的 Fairwater AI 数据中心的设计正在持续优化 Token 的经济性。
此外,微软已经完成了对 NVIDIA Vera Rubin 平台的验证,该平台现已全面投产,并将部署于 Azure 数据中心。
Vera Rubin 平台无需对现有基础设施进行任何改造,即可与 Blackwell 平台无缝衔接,其每兆瓦的推理吞吐量最高可提升 10 倍,并将每个 AI 智能体 Token 的成本降低了一个数量级。内置的 NVIDIA 机密计算功能,能够在 AI 智能体大规模进行逻辑推理时,为模型和数据提供严密保护。而 NVIDIA Dynamo 推理框架则将这些优势延伸到了软件领域,不仅加速了 AKS 上的模型冷启动,还通过 NVIDIA Grove 带来了原生支持 Kubernetes 的分布式推理编排能力。
阅读此 Microsoft 博客了解更多内容。
