Eureka！NVIDIA 研究突破为机器人学习注入新动力

NVIDIA Research 开发的一款名为 Eureka 的新型 AI 智能体可以教机器人复杂的技能，它教会了机器人手快速转笔，并且第一次转得像人类一样好。

上面视频中所展示的令人惊叹的“魔术”是机器人通过 Eureka 学会熟练完成的近 30 项任务之一，Eureka 可以自动编写奖励算法来训练机器人。

Eureka 还教会了机器人完成打开抽屉和柜子、抛接球、操作剪刀等任务。

于 10 月 20 日发布的这一 Eureka 研究包含一篇论文和该项目的 AI 算法，开发者可以使用 NVIDIA Isaac Gym（一款用于强化学习研究的物理模拟参考应用）进行实验。Isaac Gym 基于 NVIDIA Omniverse 而构建，后者是一个用于基于 OpenUSD 框架构建 3D 工具和应用的开发平台。Eureka 自身是由 GPT-4 大型语言模型驱动的。

NVIDIA AI 研究高级总监、Eureka 论文作者之一的 Anima Anandkumar 表示：“在过去十年，强化学习取得了空前成功，但依然面临许多挑战，比如奖励设计需要不断试错才能完成。Eureka 是朝着开发将生成式和强化学习方法结合以解决这些艰巨的任务的新算法迈出的第一步。”

相关精彩视频已在NVIDIA中国西瓜视频账号发布：

AI训练机器人

据该论文介绍，Eureka 生成的奖励程序（可让机器人进行试错学习）在超过 80% 的任务上优于人类专家编写的程序，这使得机器人的平均性能提高了 50% 以上。