消费级计算的范式始终围绕个人设备展开 —— 从个人电脑到智能手机、平板电脑莫不如此。如今,以 OpenClaw 为代表的生成式 AI,引入了全新品类:智能体计算机。无论是 NVIDIA DGX Spark 桌面 AI 超级计算机,还是专为 AI 优化的 NVIDIA RTX PC,都能在保障隐私且免费的前提下,出色运行个人智能体。
本周举行的 NVIDIA GTC 大会将发布一系列代理式 AI 相关新闻,包括:
- 适用于本地智能体的全新开放模型,包括 NVIDIA Nemotron 3 Nano 4B 和 Nemotron 3 Super 120B,以及针对千问 3.5 和 Mistral Small 4 的优化。
- NVIDIA NemoClaw:一个 OpenClaw 的开源软件栈,通过提高安全性并支持本地模型来优化 NVIDIA 设备上的 OpenClaw 体验。
- 使用 Unsloth Studio 更轻松地进行微调,进一步提高开放模型在代理式工作流上的准确度。
GTC 现场参会者可前往 GTC Park 参与 NVIDIA Build‑a‑Claw 活动。活动持续至3月19日,每日上午 8 点至下午 5 点举行。NVIDIA 技术专家将现场指导参与者,通过自选设备定制并部署一款主动式、全天候的 AI 助手。无论技术背景如何,参与者均可为自己的 AI 智能体命名、自定义个性,并配置所需工具权限,最终打造出可通过常用即时通讯工具随时调用的个人助理。
全新开放模型为本地智能体带来云端级品质
新一代本地模型——拥有越来越大的上下文窗口——为在 PC 上运行智能体提供了智能能力。结合更丰富的用户上下文信息和强大的本地工具,这些发展正在为 AI PC 开启新的可能性,尤其是在 DGX Spark 上,其 128GB 的统一内存可支持超过 1,200 亿个参数的模型。
上周发布的 Nemotron 3 Super 是一款拥有 1,200 亿参数的开放模型,其中激活参数量为 120 亿,专为运行复杂的代理式 AI 系统而设计。Nemotron 3 Super 非常适合在 DGX Spark 或 NVIDIA RTX PRO 工作站上运行智能体。在 PinchBench (一项用于评估大语言模型与 OpenClaw 配合表现的新基准测试) 中,Nemotron 3 Super 取得了 85.6% 的得分,成为同类开放模型中的佼佼者。
Mistral Small 4 是一个拥有 1,190 亿参数的开放模型,具有 60 亿个激活参数 (所有层的激活参数共 80 亿个),它整合了 Mistral 旗舰模型的功能。如今,用户拥有了一款针对通用聊天、编程和智能体任务进行优化的超高效模型。
这两种模型均可在 DGX Spark 和 RTX PRO GPU 上本地运行。
对于希望使用轻量化模型的 GeForce RTX 用户而言,Nemotron 3 Nano 4B 是 NVIDIA Nemotron 3 系列开放模型的最新成员,为在 RTX AI PC 上本地构建智能体和助手提供了一个紧凑而强大的起点。该模型非常适合用于打造游戏和应用程序中能够执行操作的对话型角色,并能在资源受限的硬件上运行。它适用于任何搭载 NVIDIA GPU 的系统,将最先进的指令遵循能力和出色的工具使用能力与极低的显存占用相结合。
此外,NVIDIA 还宣布针对阿里巴巴的千问 3.5 模型进行优化,该模型 (27B,9B 和4B 参数版本) 展现出卓越的精准度,适合在 NVIDIA GPU 上运行本地智能体。这些新模型原生支持视觉处理、多Token预测和 262K 的超大上下文窗口。其中,拥有 270 亿稠密参数的模型与 RTX 5090 D v2 GPU 搭配使用时表现尤为出色。
用户现在可以通过 Ollama、LM Studio 和 llama.cpp 体验这些模型,借助 RTX GPU 和 DGX Spark 提供加速推理。详细了解 NVIDIA 开放模型的最新动态。
借助经 RTX 优化的最新模型,创作 AI 更高效
Lightricks 于本月初发布的先进的音频视频模型 LTX 2.3 现已发布 NVFP4 和 FP8 蒸馏模型,可将性能提升至原来的 2.1 倍。详细了解 Lightricks 的 LTX 2.3 模型。
此外,Black Forest Lab 的 FLUX.2 Klein 9B 在上周进行了更新,将图像编辑速度提升至原来的 2 倍。NVIDIA 与 Black Forest Labs 合作发布了 FP8 版本,针对 RTX GPU 进行了优化,以实现更快的性能和更佳的显存占用表现。
NVIDIA NemoClaw——NVIDIA 针对 OpenClaw 的优化
AI 开发者和爱好者纷纷购置 DGX Spark 超级计算机或搭建专用的 RTX PC,以运行如 OpenClaw 等自主 AI 智能体。这些智能体能够从个人文件、应用和工作流中获取上下文信息,并自动执行日常任务。然而,随着 OpenClaw 等代理式系统的应用日益广泛,人们对 Token 成本以及安全和隐私的担忧也在加剧。
为了帮助解决这些问题,NVIDIA 本周推出了 NemoClaw,这是一个基于 OpenClaw 的开源软件栈,可在 NVIDIA 设备上部署 OpenClaw 优化。NemoClaw 中首批可用的功能是 NVIDIA Nemotron 开放模型和 NVIDIA OpenShell 运行时。Nemotron 本地模型使用户能够在本地运行推理,这意味着更好的隐私保护和零 Token 成本。OpenShell 是专为更安全地执行 Claw 而设计的运行时。
详细了解 NemoClaw。观看黄仁勋先生的 GTC 主题演讲并探索会议内容。
借助 Unsloth Studio 轻松进行微调
随着开放模型取得巨大飞跃,进一步提升模型精准度的一种方法便是微调,这能让用户基于自身数据和使用场景对模型进行定制化调整。然而,这种技术通常需要深厚的技术专业知识、编码知识和大量的配置工作。作为模型微调与对齐领域的领先开源库,Unsloth 今天推出了 Unsloth Studio,这是一款易于使用的基于网页的用户界面,旨在为 AI 爱好者和开发者简化微调流程。
Unsloth Studio 支持 500 多种 AI 模型。其简洁的用户界面让训练和微调过程变得轻松简单:用户只需上传数据集,点击基于图形的画布即可生成额外的高质量的合成数据,并启动微调任务。该工具支持量化低秩适配、低秩适配和完整微调。在模型微调过程中,用户可以实时监控并可视化任务进度。最终,用户可在同一网页应用中将微调后的模型导出至所选框架,并立即开启对话交互。
Unsloth Studio 的新界面基于 Unsloth 库构建,该库通过定制化和专用 GPU 内核,在训练过程中实现了最高可达 2 倍的加速效果,同时节省高达 70% 的显存。这意味着,新用户无需复杂配置,即可直接充分利用其 NVIDIA RTX GPU 和 DGX Spark 的性能。
查看其他 RTX AI Garage 文章,了解有关使用 NVIDIA GeForce RTX GPU 微调模型的更多信息。
#GTC 2026不容错过的精彩内容
✨RTX AI 视频生成指南,其中介绍了ComfyUI 中的RTX Video:今年早些时候在 CES 上发布的全新 RTX AI 视频生成指南向创作者和爱好者展示了如何使用文本到图像的引导式工作流从概念到创作,为 AI 生成的视频制作关键帧,然后使用在本地 GPU 上运行的 RTX Video 技术将其升级到 4K 画质。立即体验该指南,并在社交媒体上使用 #AIonRTX 分享你的创作成果。
💿NVIDIA AI for Media 是一套高性能、易于使用的软件开发套件,可将 NVIDIA Broadcast 级 AI 特效——包括增强的音频处理 (支持 Linux 或 Windows 系统)、视频处理及增强现实功能——引入到直播媒体、视频会议和后期制作工作流中。最新版本更新包括:通过 RTX 视频超分辨率技术,在 RTX PRO 及 GeForce RTX 40 和 50 系列 GPU上实现更精准的唇形同步、多人对话实时检测、更快的 4K 画质提升,同时优化了 NVIDIA 音棚音效的背景降噪功能并降低了延迟。
💻 NVIDIA DLSS 5 将于今年秋季推出,它让像素拥有照片级写实光照与材质效果,以AI驱动游戏画质保真度的突破性飞跃,让渲染呈现电影级视觉效果。
🤖Maxon 发布了 Redshift 2026.4 版本,该版本引入了由 DLSS 技术驱动的全新实时可视化工作流,使建筑师能够以交互式速度和画质在项目中流畅穿梭。Maxon 首席技术与人工智能官 Philip Losch 表示:“NVIDIA DLSS 技术是关键组成部分,使我们能够以交互式速度呈现高品质视觉效果。”
🪟 Reincubate Camo 在其 Camo Streamlight 应用中新增了对 Windows ML NVIDIA TensorRT RTX EP 的支持,以实现 AI 自动调整功能,从而显著提升了 RTX GPU 上的性能表现。
NVIDIA RTX AI PC 的相关信息请关注微博、抖音及哔哩哔哩官方账号。
软件产品信息请查看声明。
