拣货达人:采用 GPU 技术的机器人在亚马逊仓库拣货大赛中夺冠

作者 英伟达中国

来自美国、德国、日本等国家/地区的强大团队齐聚一堂,开展训练、对抗,并证明自己是世界最强的队伍。

他们并非是在里约热内卢为了四年一度的体育赛事而较劲,而是前往今年在德国莱比锡举行的 Robocup 2016 活动现场,参加亚马逊仓库拣货大赛 (Amazon Picking Challenge)。今年是第二年举行该比赛,考验机器人找出拣货和装货方法。

这项比赛象征着将采用 GPU 技术的深度学习应用于仓库和工厂自动化领域的风向标。深度学习在这次比赛中扮演了至关重要的角色,前十名队伍中有五支队伍采用了该技术,其中还包括前两名的队伍。

Amazon Robotics 公司研究与先进发展部门经理 Joey Durham 说:“今年有很多队伍都使用深度学习的神经网络来识别物体,跟去年的情况大不相同。”

仓库自动化的未来

亚马逊早就在其遍及全球的大型仓库中使用了物流搬运机器人来搬运货架上的商品,更大限度降低寻找物品的工作量,这些物品接下来将运送到数以百万的顾客手中。不过要识别、抓取物品进行包装、运输和装箱,还是得靠大量的人工作业。

为了能够以自动化方式完成这些任务,以及为工业和学术机器人产学两界搭建桥梁,亚马逊举办了亚马逊仓库拣货大赛 (Amazon Picking Challenge)。参赛队伍须使用能够自动识别物体的机器人,从一系列无序的物品中抓取目标物品,然后装箱。

来自荷兰的代尔夫特理工大学队在装箱和拣货大赛中获得第一名

来自荷兰的代尔夫特理工大学 (TU Delft) 队与隶属于该学校的新创公司 Delft Robotics 合作,在拣货和装箱两项比赛中均获得第一名。该队的机器人能在 150 毫秒内检测出物体。

TU Delft 队使用了 NVIDIA TITAN X GPU 和约 2 万张图片来训练一个“基础”模型,然后在此基础上又建立了“箱”和“袋”的模型。他们使用 PyFaster-RCNN 来训练自己的深度学习系统,该系统采用 Caffe 框架,并且采用 NVIDIA cuDNN 进行硬件加速。

Delft Robotics 的计算机视觉编程人员 Hans Gaiser 说:“在比赛结束后,Delft Robotics 目前正在致力于应用在大赛期间获得的 GPU 计算相关知识,并将这些算法应用到工业系统中。”

来自德国的 UBonn Snatches 队在装箱比赛中获得第二名

来自德国波恩大学的 NimbRo 队在装箱比赛中获得第二名。该队整合了来自红外线投影与两台 Intel RealSense SR300 深度照相机的深度估计结果。还利用两台整合式全高清彩色照相机测量密集的立体深度。

NimbRo 队使用热门的图像识别基准 ImageNet challenge 进行训练,并为亚马逊拣货大赛 (Amazon Picking Challenge) 现场使用的相对少量的图片添加了注释。该队使用了具有四个 NVIDIA GeForce GTX TITAN X GPU 的 Supermicro GPU 工作站来进行训练和记忆作业。

来自日本的 PFN 队在拣货比赛中获得第二名

日本的 Preferred Networks 与工业自动化巨人 FANUC 合作,在拣货比赛中获得第二名。他们使用卷积神经网络来处理两种不同的任务:使用 Intel RealSense SR300 照相机产生的 RGBD 数据和 NVIDIA GeForce GTX 870M 笔记本电脑 GPU 以每帧图片 0.1 秒的速度进行图像分割,而不是在 CPU 上以每帧图片 2 秒的速度分割。

Preferred Networks 部署了基于 CUDA 与 cuDNN 的深度学习框架 Chainer。还使用了 10 万张使用 Blender(同样采用了 GPU)进行 3D 渲染的图片和 1500 张人工标注的照片,进行了为期两天的训练。

Amazon Picking Challenge graphic