早日康复:数据科学杯竞赛旨在加速药物研发

作者 英伟达中国

2,100 多支队伍参加了第四届年度数据科学杯竞赛。

在研发抵御疾病的药物时,十亿美元已无法将过去这一数字能够买到的东西收入囊中。

不久前,这些资金可能足以创造 30 种新药。如今,它甚至不够一种药的成本。

今年的数据科学杯竞赛可能有助于疾病治疗药物的研发。这场全球性的大规模 AI 竞赛旨在助力社会发展。2,100 多支参赛团队展开激烈角逐,力求减少激增的新药开发成本并缩短测试时间。

他们面临的挑战:利用深度学习加速和提高药物研发过程中关键环节(即识别各个细胞核)的准确性。

麻省理工学院-哈佛大学博德研究所是本次竞赛的非盈利合作伙伴,其影像平台负责人 Anne Carpenter 说:“2018 年数据科学杯竞赛旨在满足更快、更准确地研发新疗法的真实需求。”

感兴趣?现在行动还为时不晚,参赛截止日期是 4 月 9 日。最终提交日期截止至 4 月 16 日。

10 万美元现金和一台深度学习超级计算机

第四届年度数据科学杯竞赛召集来自世界各地的参赛者训练深度学习模型,以检查细胞图像并识别细胞核。

咨询公司 Booz Allen Hamilton 的数据解决方案和机器智能负责人 Ray Hensberger 表示:“如果我们能够改善这一过程,便会加速新药物和新疗法的到来。”

此次竞赛由 Booz Allen 和数据科学竞赛的 Kaggle 平台共同举办,并获得了 NVIDIA、医疗诊断公司 PerkinElmer 等提供的其他赞助。除了可能促进药物研发外,优胜团队还将分得 17 万美元的现金和奖品,其中包括一台 NVIDIA DGX 工作站个人 AI 超级计算机。

摩尔定律的对立理论

寻找新药是一项复杂而艰巨的任务,每开发一种新药都可能会花费数十亿美元,耗费十年甚至更长的时间。根据倒摩尔定律 [摩尔定律 (Moore’s law) 的英文名倒序拼写] 这一观察,尽管技术有所改进,但研发新药的成本大约每九年就会增加一倍。

生物化学家尝试使用数千种化合物来确定哪种化合物(如果有)对某种特定病毒或细菌有效,以及人体会对哪种化合物产生符合预期的反应。他们通过衡量患病细胞和健康细胞对各种疗法的反应来实现这一点。

Carpenter 表示,几乎所有的人类细胞都有细胞核,因此识别每个细胞较直接的方法便是查找细胞核。她说,如今的图像处理算法可以找到细胞核并判断细胞的疾病状态,但这种算法较适用于相当圆且结构不太紧密的细胞核。

在涉及组织样本的复杂实验中,如果细胞核形状异常或结构较为紧密,这种算法便无能为力。

Carpenter 说:“有时生物学家别无选择,只能亲自检查数以千计的图像来完成他们的实验”。她在以下视频中讲述了数据科学杯竞赛的其他技术细节:

深度学习药物研发

现行方法还需要科学家们反复修改算法,从而适应不同类型的图像和细胞。Carpenter 希望深度学习软件能够在没有生物学家的介入下做到这一点,从而每年可节省出数十万小时的时间,为新的研发开辟更快的渠道。

她希望使用获奖算法来构建用于药物研发的深度学习软件。

在 Carpenter 的实验室工作的博士后研究员 Kyle Karhohs 说:“深度学习将有助于在相当于或高于人类观察能力下查找图像中的相关细节。这可能会增加药物研发的规模和速度,并以超高精度和准确度提高我们描述图像中生物特征的能力。”

要了解数据科学杯大赛和类似的 AI 竞赛如何促进社会发展,敬请参加 3 月 26-29 日在硅谷举行的 GPU 技术大会,出席“AI for Social Good as a Technology Driver”(为社会发展提供技术驱动力的 AI)及其他会议。立即报名

* 这篇报道中的主要照片展示了人类细胞核的内部结构。图像由国家癌症研究所的 Steve Mabon 和 Tom Misteli 提供。