开放技术可供开发者与企业自由使用、修改和创新,贯穿了从互联网诞生到云计算早期的每次重大技术变革。AI 也不该例外。
因此,NVIDIA Nemotron 多模态 AI 模型、数据集和技术已向公众全面开放。Nemotron 可用于本地个人电脑到企业级系统上的研究与商业用途,提供了一个开放的 AI 应用构建基础平台。开发者可通过 GitHub、Hugging Face 和 OpenRouter 使用。
通过 Nemotron,开发者、初创公司及各种规模的企业都能使用基于透明开源训练数据训练而成的模型。此外,Nemotron 还提供加速工具,覆盖从定制到部署的全开发流程。
由于该技术的公开透明性,使用者能够理解模型的运作机制并信任其输出结果。
凭借其在通用智能与代理式 AI 推理方面的能力,以及对特定 AI 用例的适应性,Nemotron 如今已被制造、医疗、教育及零售等行业的 AI 创新者与领导者广泛使用。
什么是 NVIDIA Nemotron?
NVIDIA Nemotron 是一套专为提高 AI 开发全流程效率而打造的的开源 AI 技术集合,包含:
- 多模态模型:以开放检查点形式交付的先进 AI 模型,在研究生级别科学推理、高等数学、编码、指令执行、工具调用、视觉推理方面表现出色。
- 预训练、后训练及多模态数据集:精心筛选的文本、图像和视频数据集合,可用于训练 AI 模型掌握语言、数学和问题解决等技能。
- 数值精度算法和方案:先进的精度技术,能在保障答案准确性的同时,大幅提升 AI 运行速度并降低成本。
- 用于高效扩展 GPU 集群上训练规模的系统软件:这是一系列经过优化的软件与框架,可在 NVIDIA GPU 上实现大规模训练与推理加速,适配超大模型的需求。
- 后训练方法与软件:提高 AI 智能水平、安全性和特定任务处理能力的微调步骤。
NVIDIA 致力于为开发者、行业领导者和公共及私营领域的 AI 基础设施构建者提供开放、透明且自适应的 AI 平台,而 Nemotron 正是该战略的重要组成部分。

通用智能与专用智能有何区别?
NVIDIA 开发 Nemotron 是为了提升通用智能的能力 (包括 AI 推理能力),同时加速专业化进程,进而帮助全球企业使用 AI 解决行业难题。
通用智能是指基于海量公开数据集训练而成、可执行广泛任务的模型,是解决各类问题和执行各类推理任务必不可少的引擎。专用智能学习某一行业或组织机构特有的语言、流程及优先事项,使 AI 模型能够适应特定的现实应用。
要实现 AI 在各行业的规模化应用,两者缺一不可。
因此,Nemotron 提供了针对多种计算平台优化的预训练基础模型,以及 NVIDIA NeMo 和 NVIDIA Dynamo 等工具,以将通用 AI 模型转化为定制化的专用智能模型。
开发者与企业如何使用 Nemotron?
NVIDIA 开发 Nemotron 的目标是加快全球开发者的工作进程,并且为未来 AI 系统设计指明方向。
无论是研究机构还是初创公司和跨国企业,开发者都需要灵活、可信的 AI。Nemotron 提供了构建、定制和集成 AI 的工具,适用于几乎所有领域。
- CrowdStrike 正将面向安全团队的 Charlotte AI AgentWorks 无代码平台与 Nemotron 集成,帮助推动代理式生态系统的发展并保护其安全。此次合作重新定义了安全运营模式,使分析师能够大规模开发部署专用 AI 智能体,依托 Nemotron 模型打造可信赖的企业级安全防护体系。
- DataRobot 将 Nemotron 作为在其与 NVIDIA 联合开发的 Agent Workforce Platform 上大规模训练、定制和管理 AI 智能体的开放基础平台。该解决方案可在本地、混合及多云环境中建立、运营和管理一支功能齐全的 AI 智能体团队。
- ServiceNow 今年早些时候与 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。该模型使用两家公司的数据进行后训练,专门用于执行实时工作流,并且能以更小规模提供先进的推理,使其更快、更高效并且兼具经济效益。
- 伦敦大学学院主导的主权 AI 项目 UK-LLM 使用 Nemotron 开源技术和数据集开发了英语与威尔士语 AI 推理模型。
NVIDIA 还将从开发 Nemotron 获得的洞察,应用于下一代系统设计,例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型领域的最新创新成果例如精度缩减、稀疏运算、新型注意力机制、优化算法等正在重塑 GPU 架构。
例如,使用 Nemotron 开发的新数据格式 NVFP4 在大语言模型 (LLM) 训练中每个参数仅用 4 位存储。这项突破性进展大大降低了能耗,正在影响着未来 NVIDIA 系统架构的设计方向。
NVIDIA 还借助整个 AI 社区开发的开放技术优化 Nemotron。
- 阿里巴巴 Qwen 开源模型提供的数据增强方案优化了 Nemotron 的预训练与后训练数据集。其最新 Qwen3-Next 架构突破了长上下文 AI 的技术边界。该模型融合了 NVIDIA 研究中心与麻省理工学院共同开发的门控增量网络 (Gated Delta Networks)。
- 作为 AI 推理领域的先驱,DeepSeek R1 推动了 Nemotron 数学、代码与推理开源数据集的开发,这些数据集可用于训练模型掌握思考能力。
- OpenAI 的 gpt-oss 开源权重模型具有出色的推理、数学和工具调用能力,凭借其可调节的推理设置,可用于强化 Nemotron 后训练数据集。
- Llama-Nemotron 开放模型系列以 Meta 的 Llama 开放模型集合为基础,并借助 Nemotron 数据集和方法获得了先进的推理能力。
您可在 Hugging Face 上使用 NVIDIA Nemotron 模型与数据,来训练和定制您自己的 AI 模型与智能体,或在 OpenRouter 上免费试用模型。使用 NVIDIA RTX PC 的开发者可通过 llama.cpp 框架获取 Nemotron。
欢迎参加 10 月 29 日(周三)在 NVIDIA GTC Washington, D.C 上的 Agentic AI Day 活动。届时,开发者、研究人员和技术领袖将齐聚一堂,共同展示 NVIDIA 技术如何推进 AI 重点事项并驱动下一代 AI 智能体。订阅 NVIDIA 开发者新闻及加入开发者社区。关注 NVIDIA AI,及时掌握代理式 AI、Nemotron 等方面的最新动态。
