DRIVE Labs系列视频第二集：追求完美的交叉路口检测

WaitNet深度神经网络在不借助地图的情况下识别交叉路口。

编者注：这是NVIDIA DRIVE Labs系列视频的第二集，在上一集中我们介绍了NVIDIA如何为自动驾驶汽车构建路径感知。通过DRIVE Labs系列，我们将以工程技术为重点的视角关注实现自动驾驶汽车的各个挑战以及NVIDIA DRIVE AV软件团队如何应对这些问题。

任务：借助基于AI的实时感知进行交叉路口检测

方法：WaitNet深度神经网络

在交通信号灯控制下的交叉路口行驶似乎是很正常的事情。但是当NVIDIA BB8自动驾驶测试汽车去年首次完成这项任务时，工程师们都露出了欣慰的笑容。

这是因为仅借助我们基于AI的实时感知深度神经网络，车辆就能够实现对交叉路口的检测，继而自主停车并通过路口。整个过程完成得十分精确。

我们所使用的方法是，借助基于AI的场景理解对交叉路口进行实时感知和分类。我们并没有试图检测并将单个特征（如停车标识，交通信号灯，车道线标记等）拼凑起来作为交叉路口的证据，而是借助WaitNet深度神经网络完成基于场景的检测和分类。

WaitNet这个名字来源于其使命，即检测自动驾驶汽车必须停车等待的情况。它是一种卷积深度神经网络，通过摄像头图像数据进行训练，推理各种需要等待的情形（如交叉路口、施工区域和收费站）并将其分类。

然后，这些所得出的结果可以作为地图绘制和行为规划组件等更高层级自动驾驶汽车软件模块的输入数据。

如同人类驾驶员的检测

WaitNet的交叉路口检测及分类过程与人类驾驶员检测交叉路口的方式相似。整个场景由许多特征组成，而不是只有单独的指示标，如停车标识，交通信号灯或者特殊地点或位置的车道线标记。我们的视觉系统会同步感知场景并检测是否有交叉路口出现，并对其进行分类。

借助AI进行基于场景的感知都有哪些优点呢？首先，它不需要手动确定哪些视觉特征与整体交叉路口感知相关或无关，也不需要针对每个类型的交叉路口进行硬编码来编写规则并将视觉特征与之结合。这种具体问题具体分析的“蛮力”方法的复杂性使其并不能很好地扩展，因为这世界上交叉路口的种类繁多。

此外，由于不过度依赖单独的特征，该系统能够减少特征级检测错误的发生机率。例如，因为没有成功检测停车标识而没有检测出整个交叉路口的情况。同时，因为没有完全依赖地图所指示的交叉路口位置及类型，我们可以减少由于引入不完整或错误地图所造成的漏洞。

WaitNet将在DRIVE软件新版本中发布

WaitNet检测交叉路口以及其距离的功能已经从一个内部研发项目变成了可应用的软件。它作为NVIDIA DRIVE 软件9.0版本的一部分将在未来几周发布。

借助NVIDIA自动驾驶汽车传感器及计算平台组成的DRIVE Hyperion套件，以及基于WaitNet的感知功能，我们能够检测到距离车辆最远150米的大多数交叉路口。检测范围的扩大能够使汽车在接近交叉路口时以让人类驾驶员舒适的方式进行制动。

针对近距离的交叉路口，WaitNet能够提供精确的交叉路口停车点及位置检测。这项功能在城市及半城市化地区尤为重要，因为在这些环境中GPS信号精度由于多路径效应会趋于降低。

基于WaitNet的功能也将应用在未来版本的软件当中，包括每帧图像检测多个交叉路口，以及检测交通信号灯和交通标识等能力。

借助基于AI的实时感知并利用场景及环境理解来通过交叉路口的能力，为DRIVE软件增加了一个稳健可靠的关键层，也将助力我们打造更好更安全的自动驾驶体验。