逐一击破:深度学习助力数百种罕见疾病新药研发

作者 Isha Salian

为了抗击癌症、糖尿病和心脏病等疾病,我们开展了大量研究工作,并投入了诸多经费。,不过一切努力都是值得的,因为这些疾病每年都会让数千万人饱受折磨。

但是,目前还有约 7000 种已知的罕见疾病很少受到重视。这些疾病也被成为“孤儿病”,全球大约共有 4 亿人罹患此类疾病。一直以来,它们都被制药行业所忽视,因为药物研发成本与患者数量不成正比。

现在,得益于新型筹资渠道与新药研发方法,这种局面正在慢慢发生转变。

位于盐湖城的 Recursion Pharmaceuticals 公司专门从事跨多个治疗领域的药物研发工作,其中就包括目前尚无治疗方法的数百种罕见疾病,如山德霍夫氏病,这是一种遗传病,会破坏婴儿大脑和脊髓中的神经元,且往往具有致命性。在欧洲,每 10 万人中就至少有 1 人罹患山德霍夫氏病。

Recursion 是 NVIDIA Inception 虚拟加速器计划的成员,他们正在利用深度学习技术分析生物图像。这家初创公司在风投阶段募集了超过 8500 万美元的资金,他们的目标是在 2025 之前研发出 100 种新型疗法。

Recursion 拥有一个配备了机械手的实验室,每周可完成约 10 万次微型实验。这些实验每周可创建约 200 万张高分辨率的生物图像。

“一个人根本看不过来这些图像。”Nilsson 说道。

该公司部署了 100 多台 GPU,其研究人员每周会使用几万亿字节的数据来训练数十个神经网络。每个月,他们会通过其机器学习算法运行 250 TB 的数据,力图找到具有前景的罕见疾病候选药物,如遗传性出血性毛细血管扩张症,这是一种遗传性疾病,会导致血管畸形和潜在性出血。

“通常情况下,制药公司会研究一种疾病和一种假设,一次只研发一种药物。”Recursion 数据科学产品高级总监 Lina Nilsson 说道,“我们则选择多管齐下,一次筛查数百种不同的疾病,研究成千上万的药物分子。”

壮阔前景:利用生物图像进行药物研发

如果一个细胞发生病变,那么这个细胞的结构外观就会与健康细胞不一样。因此,确定某候选药物是否有效的方法之一,是将该药物化合物运送到病变细胞内并观察效果。

如果该细胞的结构发生改变,与健康细胞的结构越来越相似,那么这种候选药物就是具有前景的。但是,检测细胞的形态变化非常困难,此外,研究人员也希望能够以最快的速度,分析尽可能多的候选药物。

在传统药物研发过程中,科学家们一次仅专注于一种疾病,研究工作通常历时多年。通过这种方法,开发出新药并将其推向市场要花费超过 20 亿美元

“这种循序渐进的方法耗时较长,且受限于我们对于生物学的有限认知水平,”Recursion 首席科技官 Mason Victors 说道,“利用我们打造的平台可以同时研究多种疾病,而沿用之前循序渐进、以目标为导向的方法是无法做到这一点的。”

一般而言,科学家会设计相应的实验以研究细胞显微图像的一个或多个特征,如此一来,一次实验仅可以验证数量有限的假设。与之相比,借助利用了卷积神经网络的深度学习算法,Recursion 能够在一周内分析 1000 万细胞的数百种特征,并一次验证数十种假设。

该团队依靠大型 NVIDIA GPU 集群实现训练和推理工作。据 Victors 称,通过利用 NVIDIA V100 Tensor Core GPU 和 NVLink 进行多 GPU 训练,他们能够“加速网络训练速度,在几个小时内即可完成一位研究者过去需要两三天才能完成的工作。”

深度学习让研究者可以一次研究数百种细胞特征和疾病,进而迅速投入感兴趣的新治疗领域,研究先前未知领域的药物化合物。

这些工具也揭示了药物化合物与人体其他细胞之间可能发生的相互作用,以及药物化合物可能具有的潜在毒性,如损害肝脏或引起心律失常。

虽然 Recursion 主要专注于公司内部的药物研发,但他们也在与想要筛查大量化合物的其他制药公司开展合作。

Recursion 的工作流包括针对 80 多种疾病模型进行测试的化合物。其中一种化合物已获得 FDA 批准用于第 1 阶段临床试验,且目前正在接受人体临床试验。与此同时,Recursion 的制药合作伙伴也已挑选了其他几种化合物用于进一步研发。