NVAIL 合作伙伴在 NIPS 大会上展示开创性 AI 研究

作为神经网络最重要的活动，过去的一周里听说到年度 NIPS 大会的人可能比过去 30 年都多。

曾一度被认为晦涩难懂的 NIPS 大会上周在加州长滩举行，大会吸引了《纽约时报》、彭博社、《经济学人》和其他主要媒体的报道，重点关注 AI 经过惊人的增长，成为热门领域，以及各大公司招募开发人才的疯狂场面。

回想一下 NIPS 走进领域前沿地位的缘起：世界级研究成果的分享推动了人工智能技术发展。

我们的两个 NVIDIA AI 实验室 (NVAIL) 合作伙伴就属于这些展示突破性成果的团队之列。纽约大学的研究人员推进了计算机对复杂图像中的物体进行分类的能力，并朝着可宽泛理解为机器外围视觉的方向迈出了一步。

赋予图像识别再看一眼的机会

在 NIPS 大会上，纽约大学的首席研究员 Sean Welleck 介绍了他的团队如何使用强化学习来帮助计算机更好地分类图像中的物体。

该团队的多目标识别模型不是以机械的方式（例如从左到右；从顶部开始，一直到底部）观察图像，而是对图像中的所有物体进行高层级的观察。如果它识别的物体可以正确分类，那么它会更仔细地观察，如果识别正确，就会得到奖励。然后继续识别另一个它有胜算的物体。

这种以任何顺序分类物体的能力是一项重大的技术进步，将能够实现更快速、更准确地图像分类。它还最大限度地减少了对象注释的需求。对象注释通常需要繁重的工作才能获得良好标记的数据集，以用于图像分类。Welleck 的研究充分利用现有的标签。

这项研究也向计算机周边视觉领域迈出了一步，其关注点包括两个层面，一是扫描物体图像，二是对可能感兴趣的物体确定并实施更仔细的观察。

奖励复杂任务

在伯克利，Justin Fu 是此项研究工作的首席研究员，他要解决如何激励机器完成复杂任务的强化学习问题。一项经典奖励测试是游戏《乒》(Pong)，AI 或聪明的幼儿都能学会操纵手柄，成功地保持弹球持续弹跳。

但是一些游戏选项更多的游戏，如《毁灭战士》(Doom) 等，对于 AI 和很多高智商的人来说具有更大挑战性，因为只有在成功完成更长的系列任务后才能获得奖励。如果任务非常复杂，那么随机完成任务并获得奖励的机会就很小。

研究团队提出使用一种被称为范例模型的解决方案。模型在其中被激励，采取行动并产生意想不到的结果，因此您的机器人在迷宫中每次看到 T 字路口时并不会同样地尝试左转。相反，激励模型将去探索环境中的其他选项。

它通过确定新图像与之前观察的所有图像之间的差异来做出选择。该模型并不比较图像之间的原始像素，而是训练一个分类器，通过与之前检查过的内容相比较来区分图像中的新内容。

借助 GPU 计算，该模型可以快速处理大量图像并对其进行分类。注意到环境的细微变化有助于模型尝试新的选项，并更好地找出成功完成任务的方式。

纽约大学和伯克利分校是 NVIDIA NVAIL 计划支持的全球 20 所大学中的两所。NVAIL 帮助这些大学的研究人员通过 NVIDIA 研究人员和工程师的帮助、对大学生的支持以及业界最先进的 GPU 计算能力（如 DGX-1 AI 超级计算机），来推进其研究工作。