乳腺 X 线摄影能够帮助人们及早发现乳腺癌,从而挽救生命,但是也有检测不出的时候。
乳腺癌是女性最常见的癌症,同时也是引发女性癌症死亡的第二大原因。
但是,美国国家癌症研究所 (National Cancer Institute) 表示,作为筛查乳腺癌的标准方法,乳腺 X 线摄影的漏诊率达五分之一,或者存在误诊情况(假阳性),使女性忍受不必要的手术之痛和焦虑之感。
加利福尼亚大学旧金山分校 (University of California, San Francisco, UCSF) 计算健康科学研究所 (Institute for Computational Health Sciences) 的儿科学、病理学和检验医学教授 Dexter Hadley 博士说:“在收集(数字化)乳腺 X 线影像的 20 年里,我们了解到数字化乳腺 X 线摄影的效果并不如预期。”
Hadley 既是一名工程师,也是一名医生,他正在努力改变这一现状。目前,他和 UCSF 的同事正在使用 GPU 加速的深度学习来提高乳腺 X 线摄影的诊断准确率。
假阳性
目前,UCSF 研究人员正在训练神经网络准确区分乳腺 X 射线下的良性肿瘤和恶性肿瘤特征。
Hadley 说:“我们的目标是比现在更早地发现乳腺癌。”
他还致力于减少由于乳腺 X 线影像中的异常而触发癌症警报的情况的发生 – 即便这种异常实际上是无害的。10 年来每年都会参加乳腺癌筛查的美国女性中,过半数的人都遇到过假阳性的情况,为此她们需要接受进一步的检查,通常是手术活检。
此外,乳腺 X 线摄影所能发现的癌症有两种:乳腺导管内原位癌和微小浸润性乳腺癌,而这两种癌症可能不会危及生命。美国国家癌症研究所表示,对于这些癌症,医生不容易判断是否需要治疗。结果,一些女性接受了她们本不需要做的放疗、乳房肿瘤切除术等治疗。
教会计算机读懂乳腺 X 线影像
为了解决这个问题,UCSF 团队收取了 30,000 多份手写病理报告,并且使用深度学习算法推断各个癌症患者的病情进展。研究人员将这些数据与 700,000 多张乳腺 X 线影像关联起来。
然后,他们使用 NVIDIA GPU 和 cuDNN 加速的 TensorFlow 深度学习框架,训练卷积神经网络根据乳腺影像预测癌症诊断。
当研究人员测试这种算法时 – 使用 NVIDIA TITAN X GPU 进行推算,这与放射科医生对一个特别复杂的乳腺 X 线影像的解释结果相符。Hadley 将这种算法设想成一种工具,放射科医生可以用它来做决策。
捐献乳腺 X 线影像供研究使用
Hadley 的下一个计划是开发一种能够精确识别问题的系统,比如是良性肿瘤还是囊肿,是浸润性乳腺癌还是非浸润性乳腺癌,或者是否是从其他器官扩散过来的癌。他还打算使用深度学习预测肿瘤生长速度。
Hadley 说道,这还需要一段时间,要等他获得训练鲁棒深度学习模型所需要的上百万张乳腺 X 线影像之后才能开始这项工作。尽管美国每年可以收集到 4,000 万张乳腺 X 线影像,但是国家健康隐私法禁止使用这些影像。
因此,Hadley、UCSF 以及他们的合作伙伴呼吁女性捐献她们的乳腺 X 线影像或其他乳腺影像数据,以供研究使用。请登录 https://www.breastwecan.org/ 报名参与捐献活动。Hadley 也特别感谢西部数据公司 (Western Digital) 捐献了 PB 级别的存储设备,以支持他的工作。
Hadley 希望通过研究五百万张乳腺 X 线影像,开发出一种用于乳腺癌精确成像的人工智能技术。
提高乳腺 X 线影像的诊断准确率
最后,Hadley 的目标是通过使用大数据为各个患者量身定制更精准的治疗方案。
Hadley 称:“我们正在尝试教会计算机识别乳腺 X 线影像下的癌,然后教会放射科医生应该关注影像中的哪些特征。”“我们工作的最高目标是提高整体医学水平。”
参加 3 月 26 日至 29 日在硅谷举办的 GPU 技术大会 (GPU Technology Conference) ,了解有关 Hadley 使用深度学习获取更精准的乳腺 X 线影像的更多信息。立即注册,早报名者可享受优惠价格。
本文的主图是由美国国家癌症研究所和匹兹堡大学癌症研究所 (University of Pittsburgh Cancer Institute) 的 Wei Qian 提供,展示的是癌细胞分裂。