NVIDIA 全面升级 RTX PC 和 DGX Spark 上的本地 AI 智能体

COMPUTEX 期间的 GTC 台北,NVIDIA OpenShell将安全智能体带到 Windows,并在 llama.cpp 上实现高达 2 倍的推理性能加速。Adobe 对旗下应用进行重构,以带来性能提升,Blender 加入 NVIDIA DLSS 4.5 光线重建支持,并适配 NVIDIA RTX Spark。
作者

个人智能体正迎来爆发式增长,OpenClaw 和 Hermes 等开源项目在 GitHub 上正受到 AI 开发者社区的接纳和使用。这些智能体能够适配用户的个人偏好和工作流,可与应用交互、生成内容、自动执行重复流程并管理多步骤任务,同时全流程均在本地端侧运行。

6 月 1 日,在 COMPUTEX 期间的 NVIDIA GTC 台北上,NVIDIA 发布了 NVIDIA RTX Spark,这是一类专为个人智能体打造的全新 Windows PC。同时,NVIDIA 还发布了一系列更新,将本地智能体能力进一步扩展至更广泛的 NVIDIA RTX 和 DGX 生态系统。

在本地设备上运行 AI 智能体,既需要强大的安全性,也需要高性能硬件。RTX Spark 凭借高达 1 Petaflop AI 性能和 128GB 统一内存,足以应对本地 AI 智能体的计算需求,让电脑从单纯的工具进化为智能搭档。RTX Spark 专为 AI、创作和游戏而生,将 NVIDIA 30年技术创新沉淀带到具备全天续航的轻薄 Windows 笔记本电脑和超高能效的桌面主机。

NVIDIA 与 Windows 的合作将从个人解决方案扩展到企业解决方案。本次展会上发布了适用于 Windows 的 NVIDIA DGX Station,一款面向专业人士的极致 AI 台式超级计算机 ,在配备 Windows 桌面系统中搭载用于推理的数据中心级 GPU 和 CPU ,以实现可管理性、安全性与兼容性。

其他发布内容包括:

  • NVIDIA OpenShell 运行时即将登陆 Windows。它基于微软面向智能体的全新安全基元构建,为开发者提供易于部署的端侧安全智能体套件。Hermes Agent 和 OpenClaw 的全新 Windows 应用中也将集成 OpenShell 和 Microsoft 安全基元。
  • NVIDIA NemoClaw 蓝图正在扩展到 NVIDIA 所有本地 AI 产品线,包括 GeForce RTX、RTX PRO、RTX 和 DGX Spark,以及 RTX 和 DGX Station,并带来全新的简化安装程序和对 Hermes Agent 的支持。
  • 借助 llama.cpp 和 vLLM 中的多 token 预测技术,顶级智能体模型可实现最高 2 倍的推理性能加速。llama.cpp 和 ComfyUI 也将迎来全新的多 GPU 优化。
  • H Company 发布针对 RTX 和 DGX PC 优化的computer use工具,包括全新模型和即将推出的桌面智能体运行约束框架。
  • Adobe 正在重构 Photoshop 和 Premiere 应用,Blender 正在加入 NVIDIA DLSS 4.5 光线重建支持,NVIDIA RTX Video 帧生成即将登陆 ComfyUI。所有这些更新都将于今年秋季随 RTX Spark 一同推出。
  • NVIDIA Broadcast 2.2 更新带来音棚音效功能优化和 Elgato Stream Deck 支持。NVIDIA Project G-Assist 也加入了 Stream Deck 集成。

本地代理式 AI:Windows RTX PC 上实现个性化、私密和高速的体验

智能体的大规模普及一直受到限制,核心原因在于:用户难以在自己的主力 PC 上安全、私密地运行智能体

NVIDIA 与微软携手应对这一挑战,打造一套用于在端侧强大、安全运行 AI 智能体的 Windows 平台。

双方的合作建立在坚实的基础之上 —— 包括全新的 Windows 安全基元和 NVIDIA OpenShell™ 运行时 —— 以确保 AI 智能体能安全运行,并完全处于用户掌控之下。

全新 Windows 安全基元为智能体的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。NVIDIA OpenShell 提供额外的策略管控能力,允许用户自定义智能体可以执行哪些操作,智能地根据用户的隐私策略将请求分配给本地模型处理, 并在向云端模型发送请求前对其中的个人信息进行脱敏和隐藏。

这套强大的安全与隐私防护层正被 Hermes Agent 和 OpenClaw 等前沿 AI 智能体开发者采用,并集成到其新款 Windows 应用中。这些新应用将让用户便捷、安全地使用强大的本地 AI 智能体,这些智能体可在 Windows 应用中执行任务、对跨应用工作流进行推理、生成图像和视频、编写插件和应用,以及对本地文件进行语义搜索。

在本地设备上运行 AI 智能体,既需要强大的安全性,也需要高性能硬件。RTX Spark 凭借高达 1 Petaflop AI 性能和 128GB 统一内存,满足足以应对本地 AI 智能体的计算处理需求。

NVIDIA 也正在加速这些智能体所依赖的本地开源模型生态系统。

NVIDIA 与 llama.cpp 社区合作,引入了多 token 预测 (MTP) 等功能和优化。MTP 是一种预测解码技术,由较小的草稿模型一次生成多个 token,再由目标模型在单次推理中进行验证。结合程序化依赖启动等其他优化,Qwen 3.6 和 3.5 27B 可实现最高 2 倍的性能加速,Qwen 3.6 和 3.5 35B 可实现 1.6 倍性能提升。这些更新均可通过 llama.cpp webUI 和 LM Studio 获取使用。

对拥有多 GPU 设备的 AI 发烧友而言,NVIDIA 与开源社区合作,增强了两款最热门的本地 AI 工具:

  • llama.cpp 加入张量并行执行;在两张性能相当的 GPU 上,最高可获得 2 倍容量的显存和 1.8 倍计算性能提升
  • ComfyUI 加入一种新的无分类器引导 (CFG) 方法,在两张性能相当的 GPU 上最高可带来 2 倍性能提升;同时还提供了将模型工作链分配到多张 GPU 的选项,以充分利用融合的显存。
图注:展示 llama.cpp 上张量并行 Multi-GPU 技术相较于流水线并行和单 GPU 推理的 token 生成性能提升。

NVIDIA 正在与 H Company 携手扩展智能体能力。H Company 的 Computer Use 框架可让智能体像真实用户一样,通过“看”屏幕并使用鼠标和键盘来操作电脑;即便某些应用没有 API,也能完成交互。该框架即将支持 RTX 和 DGX PC,并提供对本地模型的支持

NVIDIA 与 H Company 合作,对其先进的 Holo Computer Use 模型进行量化,并加速其运行约束框架,以在 NVIDIA GPU 上 2 倍性能加速,同时将内存占用降低 35%。这些模型现已开放下载,Holo Desktop 应用也将很快推出。

面向 Linux 的智能体优化

对于需要随时使用本地智能体的开发者,NVIDIA DGX Spark 是在 Linux 环境下性能最强的个人智能体 AI 计算机,集成了大容量内存、快速计算和 NVIDIA CUDA 生态系统。

本月的 DGX Spark OS 更新带来了更顺畅的开箱即用体验,包括更简洁的 NemoClaw 安装器,以及对主流 Agentic 模型更快的推理速度。

如今,NemoClaw 已可用于所有采用 Linux 和 Windows Subsystem for Linux 的 NVIDIA RTX 与 DGX PC。借助新的简化安装器,用户能够在 Linux 上安全部署本地智能体,获得自动沙盒保护,并新增 Hermes Agent 支持。

NVIDIA 与 vLLM 展开合作,专门为智能体场景优化推理性能,同时推出了 vLLM 端的优化,以及适用于 Qwen 3.6 35B 的新版优化 NVFP4 checkpoints。相较于 Unsloth 之前提供的 NVFP4 checkpoints,这些更新在 DGX Spark 上可实现 2.6 倍性能提升,并带来了内核优化,以及对 MTP 的混合精度与 CUDA Graph 支持

请查看 vLLM 博客,了解如何在 DGX Spark 上部署 NVFP4 混合专家模型服务,从统一内存调优到可运行的 NVIDIA Nemotron 3 Super 参考设置。

携手 Adobe 带来强大的创作体验

NVIDIA 与 Adobe 合作,为 RTX Spark 从底层重构 Adobe Premiere 和 Photoshop。Photoshop 中由 Firefly 驱动的生成式填充,以及 Premiere 中的生成式扩展,是数百种加速工具中的一员,可提供强大的创作能力、精确度和控制力。RTX Spark 将这些能力进一步提升,在创意工作流中实现最高 2 倍加速的 AI、剪辑、调色和特效处理性能。

Adobe Premiere 将采用一套全新的视频处理管线,充分利用 RTX Spark 的统一内存、Blackwell GPU 和 TensorRT 软件,为剪辑和调色带来实时性能、GPU 加速的 AI 表现,以及更高效的复杂时间线渲染。

此外,Adobe 的 Substance 3D Painter 和 Stager 也将原生运行于 RTX Spark 上,从而让 3D 贴图绘制和场景创建工作流程更加顺畅、响应更快速

Adobe 下一代 Photoshop 引擎将为 GPU 加速的图片合成进行优化,支持实时滤镜、高动态范围和现代自然笔刷。该 AI 原生工作流可利用包括 TensorRT 在内完整的 RTX Spark 强大能力。

Adobe 还将进一步扩展 Premiere 和 Photoshop,使用户能够借助 Windows 智能体进行创作、编辑和设计,为创作者提供协同工作的智能搭档,加速创意工作流。

面向 Adobe Premiere、Photoshop 和 Substance 等创意应用的更新预计将随 RTX Spark 上市陆续推出。

面向创作者的新工具和应用更新

全新 NVIDIA 平台更新和合作伙伴应用优化正在更广泛的 RTX 生态系统中陆续推出,一些更新已于 6 月 1 日发布,另一些将于今年秋季随 RTX Spark 推出。

NVIDIA Broadcast 2.2 中的 Studio Voice 功能正式结束测试。这个 AI 功能可以让任何麦克风呈现出录音棚级音质;现在它已支持在 GeForce RTX 3060 及以上 GPU 上运行,性能也有所提升。同时,该应用还加入了 Elgato Stream Deck 集成和可自定义键盘快捷键功能。

Blender Cycles 将引入 DLSS 4.5 光线重建作为新的降噪选项,把原本的路径追踪视口提升为可实时交互的查看器。这样 3D 创作者可在场景中,以接近最终成片的渲染质量实时预览,从而显著改善布光和视觉风格开发流程。该更新预计会在今年秋季随 Blender 5.3 发布,并与 RTX Spark 同步推出。

RTX Video 帧生成将随 RTX Spark 一同推出。这是一款全新 AI 特效,可将视频帧率实时提升至 2 倍或 4 倍,非常适合增强常见的由 AI 模型生成的 15-20 FPS 视频输出。此技术将以 Python wheel 和 ComfyUI 节点形式推出,让 AI 艺术家能够以低 FPS 更快生成视频,再插帧至流畅帧率。

#别错过:RTX AI Garage 最新消息

🪐 请查看完整 NVIDIA RTX Spark 新闻稿,了解这款超级芯片、NVIDIA 与 Windows 在智能体方面的合作,以及合作伙伴笔记本电脑和小型桌面系统的详细信息。

🤖 请查看最新 RTX AI Garage 博客文章,了解 NVIDIA RTX PC 与 DGX Spark 如何加速由 Hermes 解锁的自主进化 AI 智能体。

软件产品信息请查看声明

请根据您所在区域适用的法律要求浏览、选择和使用资源。