通过声音就可以检测抑郁？这么神奇？

时间：2019-08-28 [关闭窗口]

　　相信大家对抑郁症并不陌生，据世界卫生组织统计，全球抑郁症发病率约为11%，每年有百万人因患此病而自杀，给个人、家庭乃至社会造成了巨大损失，预计到 2020 年抑郁症将上升为仅次于冠心病的人类第二大负担疾病[1]。
　　目前，药物治疗、心理治疗、物理治疗等方法虽然能有效治疗和改善抑郁症，但由于抑郁症病因复杂、人群就诊率低、现行诊断方法检出率低等原因，仍有相当一部分人群没有得到及时的诊断。在中国，抑郁症患者约占总人口的4.2%，而得到系统治疗的抑郁症患者只占总患病人数的10%左右[1]。因此，寻找一种更加便捷、客观、灵活和高效的检测方法来辅助抑郁症的快速识别成为众之所望。
　　近日，阿尔伯塔大学(University of Alberta)计算机科学研究人员开发了一种新方法，他们将几种机器学习算法相结合，改进了通过声音线索识别抑郁症的技术，这种人工智能算法可以通过人们的声音更准确地检测出人们的抑郁情绪。该研究由计算机科学系的博士生Mashrura Tasnim和Eleni Stroulia教授所开展，这篇题为“从声音中检测抑郁”的论文发表在加拿大人工智能会议上[2]。
　　01 声音真的能检测抑郁症？
　　要知道，人的声音作为人际沟通交流的媒介，包含了丰富的信息，它是情绪信息的一个重要来源。与人交流时，我们可以通过观察对方音色的圆润度、语调的高低、发音的轻重、语速的快慢、重音的强调以及语气等要素，感知对方所表达的情绪；同样，在不同情境下，我们可以通过改变自身声音的这些特征，向外界传达不同情绪信息[3]。
　　早期研究发现，生理或者心理上的轻微变化会导致声音特征的显著改变。心理疾病（或者说精神疾病）会导致病人声音特性和语音特征发生改变，针对精神疾病患病群体的声学分析发现，言语相关变量与症状测评结果存在着中等以上的相关[1]。
　　基于此，研究人员对抑郁症病人追踪调查后发现，抑郁症病人的语音具有以下特点：语速较慢、停顿次数多、停顿时间长、语音特征的变化减少、声音缺少抑扬顿挫、声音呆板等；抑郁组个体与正常个体相比，气息声更显著；抑郁症患者声音频率的变化变少；频谱特征也与患者的抑郁程度有关，有研究发现500Hz以下和500~1000Hz的声谱能量的变化程度，都和抑郁的严重程度增加相关[1]。
　　尽管语音与抑郁症的关系已经被研究过，这些语音特征的实际预测效果却鲜有人论，因此我们对语音特征在多大程度上有助于识别抑郁症并没有一个普遍的共识。不过值得庆贺的是，近日一项研究称，语音特征在预测抑郁症方面是有效的，并表示可以建立一个更复杂的基于语音特征的模型，以帮助临床诊断[4]。
　　02 手机将能捕捉抑郁情绪信息？
　　既然抑郁症患者的语音特征有其特殊意义，那我们便可利用这一特点更好地捕捉抑郁情绪信息。由Mashrura Tasnim和Eleni Stroulia教授开展的这项研究正是以寻求更直观便捷的抑郁筛查方法为目的，在标准基准数据集中开发更精确的检测只是这项工作的第一步， Stroulia解释说，他们最终的目标是通过这项技术开发一个有意义的应用，使之能在手机上运行，更加方便人们的使用。
　　不得不说这是一个大胆而又新奇的想法。人工智能自诞生以来，理论和技术日益成熟，应用领域也越来越广泛，在个人电脑时代、手机时代之后，整个社会正在进入ＡＩ时代，人工智能将逐渐影响人类生活的方方面面[5]。想象一下，你可以像使用计步器那样，只要打开手机应用，后台就可以持续收集和识别你的语音信息，通过复杂的算法将这些信息转换为情绪指标，判断你的抑郁程度。
　　前期的诊断筛查是抑郁症治疗的关键，然而抑郁症患者常常因为求医愿望不够强烈、或是对医生不够信任而错过了最佳治疗时期，但语音是一种非侵入式、临床极易获取的信息，如果这款通过声音就能检测抑郁情绪的应用能够成功研发，那么就可以在相对安全、不过多涉及隐私的情况下快速有效地检测个体的抑郁程度，极大地降低抑郁症临床筛查的困难，帮助患者得到及时有效的治疗，也可以帮助医生比较用户一段时间内的抑郁情绪改善如何。

[关闭窗口]