关于鲸鱼,了不起的深度学习故事

作者 英伟达中国

祖先们流传着一句话“踏在它们背上,您可以穿过科德角湾”,这里面的“它”指的是当今最濒危的鲸鱼物种之一北大西洋露脊鲸。由于被过度捕猎,现存的北大西洋露脊鲸还剩 500 头左右。

或许时间对露脊鲸不利,但深度学习对露脊鲸大大有利。

一场通过航拍照片识别每一头露脊鲸 (共 500 头) 的算法编码大赛于本月结束。美国国家海洋和大气管理局将利用获奖算法代码,将鲸鱼识别工作由人工方法转变为速度更快的自动化流程。

阅读 NVIDIA CEO Jen-Hsun Huang 的最新博文,详细了解深度学习和 GPU 如何改变世界。

这场竞赛由数据科学家社区 Kaggle 设计和主办,创意来自 NOAA 东北渔业科学中心海洋生物学家 Christin Khan。Khan 和其他科学家 (通过露脊鲸头顶被称为胼胝的硬皮) 识别和跟踪每头露脊鲸,并监视每个个体和整个种群的健康状况。

目前,这项工作通过人工方式完成。科学家们要将航拍或船拍的照片与新英格兰水族馆整理的北大西洋露脊鲸目录中的图片比对。Khan 表示,这项工作不仅非常艰苦,而且极为耗时,导致科学家们腾不出手开展更富成效的研究和实地考察。

发现 Facebook 可以自动检测照片库中的图片后,Khan 产生了利用类似办法识别鲸鱼照片的想法。

一头雌性露脊鲸和她的幼崽。图片由 NOAA 东北渔业科学中心 Christin Khan 提供。
一头雌性露脊鲸和她的幼崽。图片由 NOAA 东北渔业科学中心 Christin Khan 提供。

如何辨别鲸鱼

鲸鱼不会侧过身来拍好姿势等着拍照,这让图像识别成为一个棘手问题。所拍摄照片的角度、距离各不相同。在许多照片里面,水占的面积比鲸鱼大得多。

第一名得主 deepsense.io (一家大型数据分析公司,构建了基于深度学习和 NVIDIA GPU 的解决方案) 的首席科学官 Robert Bogucki 说:“与分辨猫、狗、袋熊和飞机相比,分辨鲸鱼要难得多。鲸鱼算法必须找到可能在照片中只占一小部分的精细细节。具体来说,就是鲸鱼头顶的胼胝硬皮。”

深度学习的工作原理是采用模仿人脑的算法,对许多层模拟神经网络进行训练。Deepsense.io 之所以选用卷积神经网络,是因为这种神经网络最适合用于执行图像识别任务。另外,Deepsense.io 还使用 Tesla K80 GPU 和 GRID K520 GPU 加快了训练速度。(亚军 Felix Lau 在我们的“加速计算新闻中心”内介绍了他如何在自己的解决方案中使用 NVIDIA GPU 和 cuDNN。)

Bogucki 表示:“处理这类问题的时候,一定要尽量缩短实验周期,这样才能保证完成对大量想法的测试。使用 GPU 加快训练速度的重要性也在于此。”

对于保护露脊鲸而言,使用 deepsense.io 的解决方案以及使用其他可能的技术无疑具有重要意义。不过,即便得到众多保护以及 Khan 等人的密切监视,鲸鱼仍然面临众多危机,包括船只撞击、渔网缠绕,以及生育率过低等等。

Khan 表示,NOAA 计划使用 deepsense.io 编写的代码开发鲸鱼识别软件。她最后还表示,深度学习和图像识别技术对于保护座头鲸、宽吻海豚和其他受威胁或濒危的物种也有帮助。

阅读 NVIDIA CEO Jen-Hsun Huang 的最新博文,详细了解深度学习和 GPU 如何改变世界。