遍布地图:初创公司使用 AI 重建世界,一次一张照片

by 英伟达中国

努力使用折叠纸质地图来找路的日子已一去不复返。大多数人都依靠数字地图来指引正确的方向。自动驾驶汽车也需要高度精细的地图。

但是,未来的地图需要提供的不仅仅是方向。人们希望轻松地获取有关其所处公路和道路的最新视觉信息。他们希望了解基础设施(如自行车道和自行车停放架)是否就位,以便可以方便地骑车驶向目的地。而且出于安全原因,自动驾驶汽车需要 360 度全方位了解交通环境。

位于瑞典的初创公司 Mapillary 是我们创始计划的成员,致力于通过将计算机视觉技术与社区协作相集成来帮助开发这些地图。该公司利用来自任何摄像头的街道级别图像中的数据来可视化世界环境,以改进地图、帮助城市规划发展,并为汽车行业的进步做出贡献。

并非所有随意闲逛的人都会迷路

从为印度卡纳塔克邦的 300 家悦榕庄酒店绘制地图,到以 3D 形式记录迪斯尼乐园,Mapillary 在一次一张照片地将世界拼接在一起。事实上,该公司每天会从个人贡献者社区、非营利组织、公司和政府获得数以十万计的图像。

处理如此数量庞大的数据以获得有用的结果绝非易事。为此,Mapillary 的团队使用一种名为语义分割的深度学习技术。此过程涉及将图像分解为多个语义上有意义的部分,然后对其进行分类。Mapillary 的地图数据提取需要语义图像分割的两种子类型:标准和 HD。

标准分割采用为实现成本效益而调整的过程应用于 Mapillary 数据库中的每幅图像,同时可接受损失一定程度的准确性。HD 分割仅应用于选择需要高准确性级别的选定图像。但是这种对尽量提高准确性的侧重意味着运行时间更长并且内存需求更高。

Mapillary 面临的挑战是经济高效地运行 HD 语义分割(并且为其客户提供尽可能详细的地图数据),同时保证始终能够处理流入其平台的越来越多的图像。

该公司已经使用 Amazon EC2 P2 上的 NVIDIA Tesla GPU 加速器来进行生产,而将 NVIDIA TITAN Xp GPU 用于训练其算法。最近,Mapillary 通过 Amazon Web Services EC2 P3 实例对在 Tesla V100 GPU 上运行的 TensorRT 3.0 进行了基准测试

结果 HD 分割的速度提高了 27 倍,同时内存需求降低了 81%。标准分割速度提升了 18 倍,内存需求降低了 74%。

Mapillary 的计算机视觉主管 Yubin Kuang 说:“通过将 TensorRT 的优化与 Tesla V100 相结合,我们能够以相同的处理成本提高语义分割推理期间的图像分辨率。这使我们可以使用语义分割来恢复精致细节和较小物体。”

技术改进使 Mapillary 可以更加经济高效地生成地图数据,从而帮助创建更出色、更详细且更智能的地图。

NVIDIA 创始计划

我们的创始计划中有 2,000 多家初创公司,Mapillary 也是其中一员。虚拟加速器计划为初创公司提供技术、专业知识和营销支持。