深度学习正在创造奇迹,从驾驶、语音识别到音乐创作,种种这些都实现了自动化。如今,它将助力科学发现,而这要归功于美国能源部橡树岭国家实验室 (ORNL) 的科学家开发的新软件。
该团队在 ORNL 致力于研究 GPU 加速 Titan 超级计算机,开发了一种可以自动生成神经网络的算法。这些神经网络以人脑中的连接为模型自由构建而成,并以深度学习的方式进行“学习”。
MENNDL 是深度学习多节点进化神经网络的简称,用于评估和测试科学家收集的独特数据集之类的神经网络并对其提供建议。借助 GPU 加速,其速度变得非常快,可将需要几个月才能完成的工作缩短到几周。
“MENNDL 可以节省人们的时间,提高科学发现的速度,”ORNL 自然启发机器学习团队的研究科学家 Steven Young 说。
面向科学家的 AI
尽管 ORNL 团队为科学家创建了 MENNDL,AI 的转变范围也可能得到拓宽。通过训练神经网络,研究人员创建了一款执行特定任务的软件。ORNL 的软件自身可以创建网络,因此,取消了一般情况下配置网络时所需的试验和纠错流程。
该算法可以跨越 Titan 的 18,688 个 Tesla GPU 进行扩展,同时对几千个潜在网络进行测试和训练,从而预测更适合相应工作的网络。
在许多领域,研究人员使用现有的神经网络或数据集作为其进行深度学习研究的平台。但是,这不适用于这些科学家:其数据来自科学仪器,并且与用来教计算机识别脸部或理解语音的数据有很大不同。
“我们在实验室使用的数据提取自中微子探测器、电子显微镜或一些其他科学仪器,”Young 说。“这与猫狗的图片有很大的差距。”
Fermi 国家加速器实验室的 MINERvA 中微子探测器。
24 小时周转
MENNDL 已经加快了中微子物理的研究速度。中微子是亚原子颗粒,科学家认为它们可以揭开宇宙起源和物质本质之类的未解之谜。
由于中微子探测起来极其困难,DOE Fermi 国家加速器实验室 (Fermilab) 使用高流强束来研究它们与普通物质的相互作用的方式。这会生成海量数据,研究人员必须对这些数据进行分析,才能精确识别发生相互作用的位置。
Young 说,过去,Fermilab 团队需要花费好几个月时间来测试神经网络,才能找出有助于解决问题的网络。MENNDL 只需 24 小时即可完成。
“有了 MENNDL,科学家不再需要花费几个月时间来寻找适合的深度学习框架,只需一天时间即可找出有助于处理数据的网络,”Young 说。
因此,研究人员可以在短时间内进行更多的试验,更快地推动科学进步。
有关更多信息,请参阅 ORNL 的论文:Optimizing Deep Learning Hyper-Parameters Through an Evolutionary Algorithm(通过进化算法来优化深度学习超参数)。
要详细了解 ORNL 在深度学习和超级计算方面的新研究,请参加 3 月 26-29 日在硅谷举行的 GPU 技术大会。立即报名。
* 本文主图显示的是 Fermi 国家加速器实验室 MiniBooNE 中微子探测器的内部。