深度学习协助机器人学习人类的行走方式

作者 英伟达中国

机器人 Darwin 行走时身体仍会摇摇晃晃,有时候还会跌倒。但它跟大多数机器人不一样,它会从错误中学习 (就像人类一样),然后迅速地调整技术。

它的蹒跚学步将会促使新一代自动机器人的产生,这类机器人无需人类重新设定程序,便可根据变化的环境和新的情境进行自动调整。这些机器人将能够执行救援或清理灾区等危险任务,或者成为家务或包裹递送小帮手。

带领 Darwin 研究计划的加州大学伯克利分校博士后研究员 Igor Mordatch 表示:「自动机器人将能够接受更高水平的目标,并找出实现的方法,那将会是一股极为强大的力量。」

机器人的学习方式

Darwin 从两个GPU 加速深度学习网络获得它所需要的知识。深度学习技术通过多层模拟神经网络,利用模仿人脑的演算法进行「学习」。这些神经网络的学习方式跟人类一样,强化或弱化神经元之间的连接来回应反馈内容。

Darwin 的学习分为两个阶段: 模拟环境和真实环境。作为基础,Mordatch 创造出模拟机器人 Darwin 实体 (身高、腰围) 的模型,以及环境的某些基本特性 (如地毯或粗糙地形)。

但是他并没有教机器人如何走路。

在模拟环境里,机器人利用已知的知识来找出正确的动作顺序,比如如何将腿摆放到位以走到特定位置,或如何扭动身躯以从卧姿站立起来。

在无人指导的情况下,机器人利用深度学习技术从地板上站起来。

在无人指导的情况下,机器人利用深度学习技术从地板上站起来。

迅速学习

在第二阶段,Darwin 须将在模拟环境中学到的东西应用到真实环境中。这时情况就变得有点复杂了。它得立即判断出如何在崎岖路面上保持平衡。当它脚踝扭动太大时就会摔倒,得重新站起来。

Mordatch 说:「尽管我们尽力让模拟环境更加逼真,但是和真实环境还是有所差距,这就是我们需要让机器人迅速学习的原因。」

要学习如此复杂的内容,得借助 GPU 的力量。

「如果我们通过 CPU 来训练机器人,可能得花费一周时间。但使用 GPU 的话,三个小时就够了。」Mordatch 说,他使用托管在 Amazon 云端环境里的 GPU 来进行训练。

深度学习技术和大脑

Mordatch 在加州大学伯克利分校机器人技术助理教授 Pieter Abbeel 的实验室工作。在 Mordatch 继续进行 Darwin 研究的同时,也将深度学习技术用于建立人体模型。他跟来自斯坦福大学的研究人员组成团队,研究人脑如何创造出动作。

这些知识有一天将能够帮助医生更好地预测某些手术会对病患的行动产生怎样的影响。