引力透镜是天文学中长期寻找和研究的对象,但一直令科学家们束手无策。借助深度学习和计算机视觉技术来处理望远镜生成的大量数据,科学家们将能够通过众多的引力透镜扩展对宇宙的了解。
如果地球与另外两个星系基本处于同一条直线上,当一个星系或星系团挡住其“后面”的另一个星系时,第一个星系的引力会使第二个星系发出的光线弯曲,此时便会出现引力透镜。引力透镜效应会使得第一个星系成为在地球观察第二个星系的放大镜。然而,引力透镜的识别已被证明是一项重大的挑战。
通过对引力透镜的准确识别,然后对望远镜数据进行分析,科学家们不仅能够更好地观察更遥远的星系,还可以从本质上了解可能遍布整个宇宙的一种未知物质形态——暗物质。
斯坦福大学Kavli粒子天文物理学和宇宙学研究所的NASA哈勃望远镜项目博士后研究员Yashar Hezaveh表示:“通过引力透镜我们可以了解很多科学知识。我们可以利用这些数据研究暗物质的分布以及恒星与星系的形成。”
深入探索深度学习
不久之前,科学家仍然通过大量复杂的计算机代码来分析图像。这种方式需要进行大量的超星系团相关计算,还需要大量的人为操作。但是,当Hezaveh与其研究团队决定运用计算机视觉技术和神经网络时,一切发生了改变。
斯坦福大学博士后研究员Laurence Perreault Levasseur,也是该主题论文的合著者,他表示:“我们当时并没想过它会有多大效果,或者它到底有没有用。”
我们也可以将引力透镜看作哈哈镜,其挑战在于消除镜像畸变的影响,并找出镜前物体的真实图像。传统方法是将观察结果与在不同哈哈镜中看到的同一物体的模拟图像大型数据集进行比较,以找出与该数据更相似的结果。
而神经网络则能够直接处理图像并找到真实图像,而无需与大量模拟图像进行比较。从原理上讲,这种方式可加快计算速度。但是,对深度学习模型进行训练,以理解各种波动如何影响物质活动以及我们的观察,同样需要强大的计算能力。
在Hezaveh和他的团队采用GPU分析数据后,他们能够快速准确地揭示有关宇宙的新见解。通过使用斯坦福大学的Sherlock高性能计算集群(基于NVIDIA GPU),该团队训练模型的速度比使用CPU时提升了高达100倍。
由此将获得对引力透镜更深入的了解,并为期望更深入认识宇宙的人提供大量素材。
Perreault Levasseur指出:“使用这一工具可以解答很多科学问题”。
全力“通缉”引力透镜
当然,要分析引力透镜的数据,首先要找到引力透镜,而这正是欧洲三所大学的科学家着力解决的问题。
作为Kilo-Degree Survey (KiDS)(一个旨在更好地了解宇宙中的暗物质和质量分布的天文观测项目)的一部分,格罗宁根大学(Universities of Groningen)、那不勒斯大学(University of Naples)和波恩大学(University of Bonn)的研究人员一直使用深度学习方法来识别新的引力透镜。
Carlo Enrico Petrillo是相关深度学习论文的合著者,他指出,即便此观测项目仅观测了一小片(约百分之四)太空,但通过运用AI技术执行KiDS时仍发现了多达2500个引力透镜。
然而,取得这个成果之前我们曾面临一个重大挑战,即缺少深度学习应用程序通常所需要的至关重要的训练数据集。Petrillo表示,他们团队的对策是:对引力透镜周围的光弧和光环进行模拟,然后将它们加入到真实星系的图像中。
“通过这种方式,我们可以利用从观测中获得的图像的所有特定特性(例如分辨率、波长和噪声)来模拟引力透镜。”Petrillo说道。
换言之,该团队将这一问题视为二元分类之一:将匹配模拟结果的光弧和光环所包围的星系标记为透镜,将不匹配的星系标记为非透镜。由于网络从每一次模拟中不断学习,因此研究人员可以缩小候选项的范围。该团队发表的论文指出,这种方法一开始就能让他们将761个候选项缩减为包含56个疑似引力透镜的清单。
NVIDIA GPU大大缩短了将图像成批与模拟结果对比所需的时间,从而帮助实现了这一成果。在CPU上对比一批图像需要25秒,而GPU则将速度提高了50倍。
“使用CPU会让我的工作苦不堪言。”他说道。
数据洪流来袭
随着望远镜和深度学习技术的不断革新,引力透镜的数据量预计会大幅增加。例如,Petrillo指出,欧洲空间局的欧几里德望远镜预计会产生数十PB的数据,而智利的大口径全天巡视望远镜每晚将产生30 TB的数据。
这意味着将需要处理大量数据、发现许多引力透镜和认识新的太空边界。这也将为科学家提出新的挑战。
Petrillo说:“找到大量引力透镜意味着可准确呈现星系的形成与演变,同时可深入了解暗物质的性质及时空连续统自身的结构。我们需要使用高效快速的算法分析所有这些数据,而机器学习无疑将成为天文学家共同关注的事情。”</p