NVIDIA DGX Spark 为桌面端最新开源与前沿 AI 模型提供强大算力支持

作者 Chris Marriott

开源 AI 正在加速各行各业的创新,NVIDIA DGX Spark 将帮助开发者将创新转化为影响力。

NVIDIA 于1月6日在 CES 2026 展示了 DGX Spark 桌面级AI 超级计算机如何让开发者在本地桌面级系统上使用最新的开源与前沿 AI 模型。其中,在 DGX Spark 上可运行 100B 参数模型。

基于 NVIDIA Grace Blackwell 架构打造,配备大容量统一内存和 PF 级 AI 性能,使开发者能够在本地进行开发并轻松扩展到云端。

在开源 AI 模型上的性能提升

得益于模型优化的持续提升以及与开源社区的合作,大量过去只能在数据中心运行的高度优化开源模型,如今可以在 DGX Spark 的桌面端获得加速。

DGX Spark 预配置了 NVIDIA AI 软件和 NVIDIA CUDA-X 库,为开发者、研究人员和数据科学家提供强大的即插即用优化能力,用于构建、微调和运行 AI。

DGX Spark 为所有开发者在桌面端运行最新 AI 模型提供基础。这些系统支持直接在桌面上运行最新的框架和开源模型,包括最近发布的 NVIDIA Nemotron 3 模型

为 DGX Spark 提供算力支持的 NVIDIA Blackwell 架构引入了 NVFP4 数据格式,可在不损失模型智能的前提下将 AI 模型压缩至高可达 70%,同时显著提升性能。

扩展 AI 与创意工作流

DGX Spark 专为支持完整的 AI 开发生命周期而打造,涵盖从原型设计、微调到推理和数据科学的全流程,适用于医疗、机器人、零售、内容创作在内的众多行业场景,满足各行业特定的AI 应用需求。

对于创作者而言,最新的扩散和视频生成模型,如阿里巴巴的 Qwen-Image,现已支持 NVFP4,可降低显存占用并加速性能。

CES 现场演示了 DGX Spark 如何将高负载的视频生成从创作者的笔记本电脑中卸载出来,相比顶级配置的搭载 M4 Max 的MacBook Pro, 实现高达8倍加速,同时释放本地系统资源,以保障创作流不中断。

开源的 RTX Remix MOD 平台将为 3D 艺术家和 Modder 助力,借助 DGX Spark 利用生成式 AI 提升创作效率。CES 现场展示了一个 MOD 团队如何将所有资产创建工作转移至 DGX Spark 上进行,从而让团队成员的 PC 能无间断进行 MOD 开发,并能够实时查看游戏内的修改效果。

AI 编码助手也在重塑开发者的生产力。在 CES 上,NVIDIA 展示了一款在 DGX Spark 上运行,并由 NVIDIA Nsight 驱动的本地 CUDA 编码助手,使开发者在享受AI辅助企业级开发体验的同时,可将源代码安全地存储在本地环境中。

行业领导者验证本地 AI 转型的趋势

随着对安全、高性能边缘 AI 需求不断增长,DGX Spark 正在整个行业中获得越来越多的关注与采用。

软件领导者、开源创新者以及全球工作站合作伙伴正在采用 DGX Spark,在无需复杂集中式基础设施的情况下,实现本地推理、智能体工作流以及检索增强生成。

他们的看法充分表明,DGX Spark 正在帮助实现更快的迭代速度、更强的数据与 IP 控制能力,并在桌面端带来全新、更具交互性的 AI 体验。

在 CES 上,NVIDIA 演示了如何利用 DGX Spark 的强大算力,结合 Hugging Face Reachy Mini 机器人,将 AI 智能体带入现实世界。

Hugging Face 产品副总裁 Jeff Boudier 表示:“开放模型赋予开发者以自己的方式构建 AI ,而 DGX Spark 将这种能力带到桌面端。当它与 Reachy Mini 结合时,本地 AI 智能体将具备实体形态并拥有自己的声音。它们可以看到用户、聆听用户,并通过富有表现力的动作做出回应——让强大的 AI 变成真正可以互动的存在。”

Hugging Face 和 NVIDIA 已发布指南,介绍如何使用 DGX Spark 和 Reachy Mini 构建交互式 AI 智能体。

IBM 数据与 AI 平台战略副总裁 Ed Anuff 表示:“DGX Spark 将前沿 AI 推理带到边缘侧。借助运行在 Spark 上的 OpenRAG,用户可以获得一个完整、自包含的一体化 RAG 堆栈,包括抽取、嵌入、检索和推理。”

JetBrains 首席执行官 Kirill Skrygan 表示:“对于需要完全掌控安全性、治理和知识产权的组织而言,NVIDIA DGX Spark 为 JetBrains 的客户带来了 PF 级 AI 性能。无论客户偏好云端、本地部署还是混合部署,JetBrains AI 都能在他们所选择的环境中提供支持。”

TRINITY 是一款面向城市出行设计的智能自平衡三轮单座车,CES 现场展示了使用 DGX Spark 作为 AI 大脑,对开源、实时视觉语言模型工作负载进行 AI 推理。

will.i.am 表示:“TRINITY 代表微出行的未来 —— 人类、交通工具与 AI agents 无缝协作。以 NVIDIA DGX Spark 作为其 AI 大脑,TRINITY 提供具备对话能力、目标跟踪的工作流,改变人们在互联城市中与出行方式的交互方式。这是一台装在轮子上的‘大脑’,从智能体理念出发而设计。”

加速 AI 开发者采用

DGX Spark playbooks 可帮助开发者快速启动真实世界的 AI 项目。在 CES 上,NVIDIA 正在扩展这一资源库,新增 6 个 playbook 并带来 4 项重大更新,涵盖最新的 NVIDIA Nemotron 3 Nano 模型、机器人训练、视觉语言模型、使用两台 DGX Spark 系统进行 AI 模型微调、基因组学以及金融分析等主题。

NVIDIA AI Enterprise 软件支持现已面向来自制造商合作伙伴的 DGX Spark 和 GB10 系统开放。该套件包含用于 AI 应用开发和模型部署的库、框架和微服务,以及用于 GPU 优化的 operator 和驱动,可实现快速、可靠的 AI 工程与部署。相关许可证预计将于 1 月底推出。

购买途径

DGX Spark 以及合作伙伴的 GB10 系统现已可通过宏碁、华硕、戴尔、技嘉、惠普、联想、微星、新华三、超聚变、紫光晓通、丽台科技、英迈,神州数码购买。

DGX Spark 的更多详情请查看技术博客文章

软件产品信息请查看声明