抑郁症是一种常见的精神疾病,全球有2.8亿人正在遭受它的困扰。为了帮助更多人及时准确地诊断抑郁症,考纳斯理工大学(KTU)的研究人员开发了一种新的人工智能(AI)模型。这个模型通过分析人们的语音和大脑神经活动,就能帮助识别抑郁症。这种结合了语音和大脑活动的新方法,能够更准确、更客观地分析人的情绪状态,为抑郁症的诊断带来了全新的希望。
KTU的教授、这项发明的作者之一Rytis Maskeliūnas说:“抑郁症对个人和社会都有很大的伤害,所以我们正在开发一种新的、更客观的诊断方法,希望将来大家都能用得上。”
科学家们发现,虽然以前很多抑郁症诊断研究都是只看一种数据,但这种新的多模式方法能够更全面地了解一个人的情绪状态。
结合语音和大脑活动数据后,这个模型在诊断抑郁症时的准确率高达97.53%,比其他方法都要好得多。“这是因为语音里有很多我们现在还无法从大脑里直接得到的信息。”Maskeliūnas解释道。
参与这项发明的KTU博士生Musyyab Yousufi说,他们选择语音数据是经过深思熟虑的:“虽然大家可能觉得面部表情更能反映心理状态,但这些数据很容易被误导。而语音能够巧妙地揭示情绪状态,比如说话的速度、语调和整体能量,这些都会影响诊断结果。”
此外,虽然面部表情有时能直接反映病情的严重程度,但研究人员还是选择了语音和脑电图(EEG)数据,因为这样能更好地保护患者隐私,而且整合多个来源的数据更有潜力。
Maskeliūnas强调,他们使用的EEG数据集是从一个专门的多模式开放数据集(MODMA)里获得的,因为KTU的研究小组是计算机科学的专家,而不是医学专家。
在收集数据时,脑电图数据是在参与者清醒、休息、闭眼时记录的,而音频部分则是通过问答和描述图片等活动来捕捉患者的自然语言和认知状态。
收集到的脑电图和音频信号会被转换成频谱图,让数据变得更直观。然后,用特殊的滤波器和预处理方法去除噪声,使数据可比较,再用一个深度学习模型来识别图像中的抑郁症迹象。
这个模型包含一个自定义的分类层,它可以把数据分成健康人群或抑郁症人群。然后,研究人员会评估分类是否成功,再评估模型的准确性。
未来,这种人工智能模型可能会让抑郁症的诊断更快、更准确,减少主观判断的风险。但这还需要更多的临床试验和改进。不过,Maskeliūnas也提到,研究的一个难点是缺乏数据,因为很多人不愿意公开自己的心理健康问题。
KTU多媒体工程系教授还提到,算法还需要改进,不仅要准确,还要能向医生提供导致诊断结果的信息。“算法必须学会用容易理解的方式解释诊断。”Maskeliūnas说。
随着人工智能在医疗、金融和法律等领域的应用越来越广泛,这种对算法解释性的需求也越来越普遍。
这就是为什么现在可解释人工智能(XAI)越来越受欢迎,它能让用户明白模型为什么做出某些决策,增加对人工智能的信任。