心理治疗师经常使用“谈话疗法”来帮助患者通过谈话克服抑郁或焦虑。
麻省理工学院的一个研究小组正在利用深度学习,开发所谓的“谈话诊断”技术,通过分析病人的言语来检测抑郁症的迹象。
该研究成果有望提供一种有效且低廉的方法,用于诊断严重的心理健康问题。
美国国家心理健康研究所 (National Institute of Mental Health) 的相关数据显示,美国每 15 名成年人中就有 1 人在一年中患有严重的抑郁症。抑郁症会对个人生活造成严重影响,但我们对这种疾病的理解仍然十分有限。
一般情况下,心理健康专家会向患者直接提出问题并得出有根据的结论,以对抑郁症进行诊断。
麻省理工学院助理研究员、计算机科学博士研究生兼本项目的首席研究员 Tuka Alhanai 表示,在未来,这些有针对性的评估可能会变得不那么必要。她希望团队的研究成果可以用于对个人心理健康提供持续监测。
数据集是关键所在
使用深度学习技术的一个关键方面是获得优质的数据。
当 Alhanai 的团队进行模型训练时,他们遇到了数据集方面的问题。她所寻求的是包含抑郁症患者谈话内容的数据集。
最后,她在南加州大学找到了此类数据集。该大学与德国研究人员合作,对 180 人进行了采访,其中 20% 的人表现出了抑郁症状。采访时长为 20 分钟,内容包括受试者的住址、交友情况以及是否感到沮丧等问题。
研究结果表明,抑郁症可以通过语言模式和所用词汇检测出来。这让 Alhanai 备受鼓舞,她还萌生了一个更加大胆的想法——排除那些有前导性的预测性问题,并训练一个模型来通过日常对话检测抑郁症。
她说:“我们可以根据数据中的相关信号判断人们是否患有抑郁症。为此,需要认真倾听整段对话,分析对话和言语的轨迹,以及谈话内容的语境和背景。”
在训练模型时,Alhanai 和她的团队使用了运行着 40 多台 NVIDIA TITAN X GPU 的机器集群,并采用了 TensorFlow、Keras 和 cuDNN 深度学习库。
他们使用数据集中删除了直白问题和提及抑郁症的访谈片段,然后让模型确定谈话者是否具有抑郁症迹象。随后,他们让模型学习健康人和抑郁症患者的谈话内容,然后告诉模型哪一个是健康人、哪一个是抑郁症患者。
经过反复学习之后,研究人员将为该模型提供另一部分对话,让模型判断谈话者是否具有抑郁症迹象。该团队以这种方式训练了数十种模型。Alhanai 表示,如果没有 GPU,这是不可能实现的。
再接再厉
该团队使用一台 TITAN X 对模型进行训练。最终,他们的模型可以通过日常对话识别抑郁症,且准确率超过 70%(与心理健康专家的准确率相同)。
在近期于印度海德拉巴举行的 Interspeech 2018 大会上,该团队提交了研究论文,并且准备继续开展深入研究。
Alhanai 说:“这项工作非常鼓舞人心。我们希望向世界展示这些模型,并协助进行抑郁症诊断。这些模型还未进入临床应用阶段。我们还需要收集更多的数据,并进一步提升诊断的准确率。”
当然,Alhanai 希望获得速度更快、性能更强大的 GPU,这样她就可以使用更庞大的数据集来进行更多的实验。长远来看,她希望利用深度学习来分析沟通方式(不仅仅是语言)对诊断和管理其他心理健康状况的作用。
她说:“人们通过谈话所能听到或通过肢体语言所能感受到的任何抑郁症迹象,机器应该都能识别出来。这些迹象可能来自口头言语、文字内容,也可能来自下颌的运动或者是紧绷的肌肉。我们的模型可以通过一种非侵入性的方法来监测这些迹象。”