从仿真到量产:如何用 AI 构建机器人

NVIDIA 最新推出的开放模型与框架,整合了仿真、机器人学习与嵌入式计算,旨在加速云端到实体机器人的工作流。
作者 Katie Washabaugh

下一代机器人将是通用型专家,既能理解指令、学习通用技能,又可针对特定任务进行训练。

可以将他们看作既博采众长、也能胜任特定工作的“万能型选手“。

构建此类机器人需打通云端到机器人的集成工作流,从而实现确保数据采集与生成、训练并评估控制策略,最终安全部署至实体设备都能无缝衔接。这些通用型专家系统依赖推理视觉语言动作 (VLA) 模型,以实现智能感知、理解并执行多样化任务。

为加速这一变革,NVIDIA Isaac 开放平台为机器人开发者提供包括模型、数据管线、仿真框架、运行时库的完整工具链,依托 NVIDIA“三台计算机解决方案“,实现机器人的大规模构建与部署。同时,NVIDIA 提供开放 VLA 模型 NVIDIA Isaac GR00T N,为开发者引导并后训练其机器人智能奠定基础。

这些模型、库和框架可在云端或边缘 AI 基础设施运行,并通过集成 OpenClaw 等长时间运行智能体进一步加速。

GTC 2026 上,NVIDIA 发布了全新智能体友好型模型 NVIDIA Isaac GR00T、Isaac 机器人仿真与学习框架,以及边缘 AI 系统。NVIDIA 为开发者带来面向通用型专家自主化时代的新一代强大工具。

这些开放工作流采用模块化设计,开发者可自由组合组件、集成自有工具与数据,并加速从原型开发到现实世界部署的进程。

Agility 通过 NVIDIA Isaac 开放框架实现机器人虚实迁移

而这一切都始于数据。

将算力转化为数据

仅在几年前,扩展机器人流程仍高度依赖开发者手动采集数据:机器人的学习效果取决于其接触的现实世界环境与不同的场景。

NVIDIA 开放库和框架改变这一局面:通过将传感器日志与遥操作演示等现实世界信号与仿真生成数据相结合,迅速将云端算力转化为海量的可用数据。

高保真且物理精确的合成数据,正帮助开发者突破人工采集的局限:很难或者几乎不可能获取足量的罕见边缘场景物理数据。这些边缘场景的数据人工难以获取或存在安全风险,却是机器人在不可预测的现实环境中大规模部署前必须掌握的核心能力。

据 Gartner 报告,当前合成数据仅占边缘场景 AI 训练数据的 20%,但到 2030 年这一比例预计将超过 90%。

NVIDIA 正借助库与开放框架推动这一转变,持续赋能基于现实世界构建的高保真合成数据工厂。

NVIDIA Omniverse NuRec 加速的 3D Gaussian Splatting 库现已全面开放下载。它可将现实世界的真实传感器数据转化为基于 OpenUSD 的交互式仿真场景,并集成至开放机器人仿真框架 NVIDIA Isaac Sim。这使得开发者能根据传感器数据扫描并重建真实世界,从而在基于真实物理交互的仿真环境中安全测试机器人。

FieldAI 结合 Omniverse NuRec 与其世界级机器人基础模型,助力工业客户将机器人与物理 AI 轻松部署至工作流中

真实数据也可通过遥操作设备采集。借助已全面开放的 NVIDIA Isaac Teleop,开发者能够通过 XR(扩展现实)头戴式耳机、身体追踪器及手套等遥操作设备收集数据,可在现实世界和仿真环境中创建演示数据,并将其用于在 NVIDIA Isaac Lab 等仿真环境中训练机器人。

借助 NVIDIA Isaac Teleop,开发者可无缝采集真实世界与仿真环境中的演示数据。

这些数据集随后通过全新的 NVIDIA 物理 AI 数据工厂 Blueprint 进行扩展。该蓝图将数据增强、评估与编排统一至单一工作流。

依托 NVIDIA Cosmos 开放世界基础模型与开源智能体编排器 NVIDIA OSMO,此参考工作流为机器人提供可扩展的生产就绪型数据引擎。基于该蓝图,开发者可以将单一的现实场景转化为全新且多样化的合成场景,而所花费的时间仅为在现实世界中采集同类数据所需时间的一小部分。

除环境与数据仿真外,机器人开发者还需对机器人本体进行仿真。通过 NVIDIA Isaac Sim,开发者可从人形机器人、自主移动机器人及机械臂中选择,并按现实世界的规格对虚拟模型进行骨骼绑定。

Isaac Sim 与 PTC Onshape 深度集成,简化机器人仿真中的骨骼绑定与修改流程

机器人采用 OpenUSD 格式渲染,能与生成环境和数据无缝交互。其动作和轨迹可被记录、回放并用于训练 AI 模型——所有环节均在接触现实硬件之前,在仿真环境中安全完成。

经受 AI 考验:策略训练

当教学素材 (即数据集) 就绪后,机器人就可开始学习新任务。这一过程始于如 GR00T 等 VLA 推理模型驱动的机器人大脑。

VLA 模型可基于特定任务数据进行后训练。比如:折叠衣服的机器人需掌握抓取衣物、识别形状、精准折叠及整齐堆叠;烹饪机器人需精通切菜、搅拌与煎炒;医院护理机器人须学会在走廊自主导航、找到电梯及向医护或患者传递物品。

借助光轮智能的仿真数据,机械臂在 NVIDIA Isaac Sim 中学习如何叠衬衫

VLA 模型完成后训练后,开发者即可对机器人策略进行全面验证。在现实世界中训练此类机器人往往耗时过长、成本高昂且风险巨大。因此开发者转而使用仿真框架,比如最新发布的 Isaac Lab 3.0 等进行训练。Isaac Lab 3.0 能同时运行数千个轻量级物理仿真环境,让机器人安全地并行演练多种场景,在短短几天内即可完成在现实世界中原本需要数年才能积累的学习量。

Hexagon Robotics 的 AEON 人形机器人在 NVIDIA Isaac Lab 中并行学习如何上下楼梯

Isaac Lab 已集成开源机器人学习物理引擎 Newton。借助 Newton,开发者可耦合多种物理求解器。这些求解器通过重力、惯性及碰撞约束等物理法则计算物体的运动,从而确保仿真行为的真实性。该技术使开发者能够对机器人如何与布料等软体对象交互,或如何在雪地、砾石等复杂地形中的行进进行仿真。

机器人开发者还可调用 NVIDIA Isaac 库与 AI 模型,这些组件优化了边缘端的运行时部署,并为操作与移动任务提供了核心构建块:

  • Isaac for Manipulation:赋予机器人物体感知、几何与位姿理解及抓取能力。开发者将感知模型与 GPU 加速的运动生成相结合,使机器人能在杂乱、动态场景中快速规划并重新规划动作;
  • Isaac for Mobility:为机器人定位、建图与安全导航提供基础。开发者利用 GPU 加速的视觉里程计与 SLAM 技术实现稳定定位,并配合实时 3D 重建技术规避障碍物及环境变化。
1X 的 NEO 机器人在 NVIDIA Isaac Lab 中学习在多样地形上行走

为确保基于仿真的学习能够迁移至现实世界,Isaac Sim 与 Isaac Lab 现已支持 Newton、NVIDIA PhysX 及 Google DeepMind Mujoco 等物理引擎,开发者无需调整机器人参数即可在不同框架间轻松切换。

仅训练单一技能远远不够,开发者还需要确保机器人技能能够跨环境与任务迁移。最新发布的 Isaac Lab-Arena 支持大规模任务配置与策略评估,简化了环境构建流程并加速复杂任务的创建,使开发者能并行评估多种任务。Isaac Lab-Arena 还可对接 LIBERO、RoboTwin 及 NIST 等工业与学术基准测试,便于开发者评估进展。

部署前的关键步骤:测试

在正式部署前,机器人必须在多种不同条件下反复测试其所学内容。从机器人运动与操作,到机器人动力学对每项任务的响应方式等每个细节,都必须在机器人投入现实世界运行前经过全面评估。

Cyngn 在 NVIDIA Isaac Sim 中测试叉车轮胎在不同坡度上的动力学表现。

全面测试包含两种模式:软件在环 (SIL) 仅测试机器人软件栈,而硬件在环 (HIL) 则验证软件栈在机器人大脑(即边缘计算单元)上的实际运行效果。

Isaac Sim 同时支持硬件在环与软件在环测试,方便开发者能在测试与迭代过程中轻松切换真实环境与仿真环境。

Wandelbots 借助 NVIDIA Isaac Sim 在高保真仿真环境中测试工厂自动化机器人

最新版 Isaac Sim 旨在帮助开发者无缝衔接各类工作流而设计:支持 NuRec 渲染以简化数据输入;同时,多物理后端使机器人能无需大调整,即可在 Isaac Sim 与 Isaac Lab 间自由迁移。

此外,该平台还可直接连接 Mega——NVIDIA 专为在数字孪生中大规模开发、测试并优化物理 AI 及机器人集群打造的 NVIDIA Blueprint。机器人开发者能将测试规模从单个机器人轻松扩展至多台甚至整个机器人集群。

Idealworks 借助 NVIDIA Isaac Sim 与 Mega,在基于物理规律的工厂环境中同时测试多台机器人

借助 NVIDIA Isaac 工作流与 Jetson 模组在现实世界中运行

当准备就绪进入部署阶段,开发者就需要高性能计算平台:能够无缝运行模型、处理多样化的高速传感器数据,并在边缘端支持各种形态与尺寸的机器人。

包括 Jetson Thor 与 Jetson Orin 在内的 NVIDIA Jetson 系列产品为全谱系 AI 驱动的机器人提供支持,实现从微型机械臂到全尺寸人形机器人的实时感知与 AI 推理能力。

智元机器人和 Bedrock 正在使用 NVIDIA Jetson 部署专为现实世界设计的机器人。

此外,NVIDIA Isaac 运行时库优化了边缘端机器人策略的运行方式。最新开源的 cuVSLAM 库能够帮助机器人实时定位自身位置并构建地图,并通过基于 Jetson 的嵌入式计算机实现精确且可靠的运动追踪。

探索新前沿

随着机器人成为通用型专家智能体,研究人员需要可进化的工作流,以便于迭代现有技能,而非从零开始重建。

NVIDIA 新推出的开放研究框架 SOMA-X 通过标准化 AI、仿真与实体机器人之间的骨骼结构、动作及身份表示来帮助解决这一问题。

借助 SOMA-X,团队无需重复进行骨骼绑定、动作重定向或集成,便可以更换不同的本体模型或机器人平台,并确保 Isaac Sim、Isaac Lab 和基于 GR00T 的管线在硬件和软件不断迭代的同时稳定运行。

随着新本体模型、数据集或硬件出现,开发者可以在无需破坏现有的工具或像 OpenClaw 这样的长时间运行智能体情况下,接入相同的 SOMA-X 共享表示形式。这些智能体正不断训练、评估并部署新行为。

在此共享本体层之上,面向研究人员的新基础模型 GEAR-SONIC 现已上线,为人形机器人提供了强大的功能。该模型基于 Isaac Lab 中的大规模人类动作数据进行训练,能够教会机器人行走、爬行、操作物体等一系列自然全身技能。这一切均通过采用单一统一策略实现,而非依赖多个特定任务控制器。

安全工具与入门资源

NVIDIA 机器人技术栈配套提供完善的安全工具和入门资源,旨在帮助团队快速从实验阶段过渡到规模化部署的可靠系统中。

  • NVIDIA Halos:完整的全栈安全系统,通过覆盖从云端到机器人的的端到端安全护栏,为机器人的安全开发、训练和部署提供保障。
  • NVIDIA GR00T X-Embodiment:该数据集包含了用于后训练 NVIDIA GR00T 的相同数据。目前该数据集在 Hugging Face 上下载量已超过 1000 万次。
  • Bones Studio 发布 BONES-SEED:包含 14 万个人类动作动画库,可用于训练人形机器人。每个动作都附有描述和时间戳,为机器人团队构建更智能、更逼真的人形机器人提供了现成的基础。该资源可通过 Hugging Face 上的 NVIDIA 物理 AI 开放数据集获取。
  • 教育资源:对于初级机器人开发者,提供了 Isaac Sim 和 Isaac Lab 的学习路径以指导开发。NVIDIA 深度学习培训中心(DLI)也提供了自学式和讲师引导类的课程,助力开启机器人开发之旅。

欢迎观看 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 主题演讲,并探索物理 AI机器人视觉 AI 相关会议。