语音特征与认知功能:重度抑郁症认知损伤的纵向队列研究及其非侵入性生物标志物探索

《BMC Psychiatry》:The relationship between cognitive impairment and acoustic features in major depressive disorder: a longitudinal cohort study

【字体: 时间:2025年11月21日 来源:BMC Psychiatry 3.6

编辑推荐:

  本研究针对重度抑郁症(MDD)患者普遍存在的认知功能障碍(如执行功能、注意力缺陷)缺乏客观、动态监测工具的问题,通过一项为期8周的纵向队列研究,探索了语音声学特征与认知功能之间的关联。研究发现,语音的频谱特征(Spectral features)与持续性注意力(CPT)和执行功能(TMT)显著相关,并且这些语音特征能够预测治疗过程中的认知功能变化。该研究为利用非侵入性语音分析作为MDD认知损伤的动态生物标志物提供了重要证据。

  
在精神健康领域,重度抑郁症(Major Depressive Disorder, MDD)不仅以情绪低落为核心症状,还常常伴随着广泛的认知功能障碍。超过90%的MDD患者在急性发作期存在至少一个认知领域的损害,尤其是在执行功能、注意力和工作记忆方面。更为棘手的是,即使情绪症状得到缓解,仍有相当大比例的患者存在残留的认知问题,这被一些研究者形容为疾病的“疤痕效应”。这些认知缺陷并非抑郁的附属品,而是具有独立临床意义的病理维度,它们会削弱患者的治疗依从性、影响心理行为干预的效果,甚至增加复发的风险。因此,如何有效、客观地监测和评估MDD患者的认知功能变化,成为临床实践和研究中一个亟待解决的关键问题。
传统的神经心理学测验虽然是评估认知功能的“金标准”,但其操作往往耗时、对施测者专业水平要求高,且难以进行高频次、生态化的动态评估。有没有一种更便捷、非侵入性且成本效益更高的方法来追踪认知功能的细微变化呢?近年来,随着数字表型(Digital Phenotyping)概念的兴起,研究人员将目光投向了人类最自然的交流方式——语音。语音的产生是一个极其复杂的神经认知过程,涉及大脑多个区域的精细协调,特别是前额叶皮层对喉部肌肉运动的控制。理论研究表明,抑郁症患者大脑前额叶与边缘系统连接的功能异常,可能导致其语音特征发生变化,例如基频(Fundamental Frequency, f0)变异性降低、语速减慢等。这使得语音分析有望成为窥探大脑认知状态的一扇独特窗口。然而,此前大多数研究是横断面设计,无法揭示语音特征与认知功能之间的动态关联,也较少控制抑郁严重程度等混杂因素,其预测认知转归的临床价值尚不明确。
为了回答这些问题,由北京大学第六医院等单位的研究人员领衔的团队在《BMC Psychiatry》上发表了一项题为“重度抑郁症中认知损伤与声学特征的关系:一项纵向队列研究”的论文。该研究创新性地采用纵向队列设计,旨在系统探讨MDD患者的语音特征能否作为反映认知损伤的多维生物标志物,并评估其在预测治疗反应(如认知改善轨迹)方面的潜力。
研究人员开展了一项为期8周的前瞻性纵向研究,纳入了53名符合DSM-IV诊断标准的MDD患者。研究在基线和8周随访时分别采集了参与者的语音样本和认知功能数据。语音任务包括朗读不同情感效价的句子以及自由表达,共计13种范式。通过对音频信号进行预处理(包括语音活动检测VAD、分帧、提取低层描述符LLDs如梅尔频率倒谱系数MFCCs、能量、基频、频谱特征等,并聚合为统计功能值),最终从每个参与者的多段语音中提取了6373个声学特征,并将其归纳为能量、音高、韵律、频谱、音质和其他六大类。认知功能评估则采用中文版简明认知测验(C-BCT),涵盖了执行功能(轨迹描绘测验TMT)、工作记忆(数字广度测验DS)、持续性注意力(连续性能测验CPT)和信息处理速度(符号编码测验SC)等多个维度,结果以标准T分表示。统计分析采用了斯皮尔曼相关分析、主成分分析(PCA)、弹性网络-自助法混合特征筛选框架以及重复测量混合效应模型等多种先进方法,以深入探索语音特征与认知得分之间的关联及其随时间的变化。
研究结果
人口统计学和临床特征
纳入的53名MDD患者中,女性占多数(79.2%),中位年龄为29岁。基线时,患者的抑郁症状较为严重(HAMD平均分为19.34)。认知评估显示,患者在TMT(执行功能)上存在具有临床意义的显著损伤,而在DS、CPT和SC上虽未达到统计学显著性,但也表现出损伤趋势。
领域信息相关的相关性结构
分析发现,不同的认知任务与特定的语音特征类别存在显著关联。TMT(执行功能)与音质特征富集性最强;DS(注意力)与频谱特征和“其他”类特征显著相关;CPT(持续性注意力)则与频谱特征显著相关。频谱特征在CPT和DS任务中均表现出显著富集,显示了跨任务的一致性。而符号编码测验(SC)未发现与任何语音特征类别有显著关联。
生物标志物簇的稳定性验证
通过稳定性特征筛选,研究人员确定了与TMT、DS、CPT分别稳定相关的语音特征集合。主成分分析(PCA)进一步将这些特征降维。例如,TMT相关的第一个主成分(PC1,解释方差58.0%)主要由频谱动态变异性主导,且与TMT得分呈负相关,即PC1值越高,执行功能越差。类似地,DS和CPT相关的PC1也对其认知得分有显著的负向预测作用。
认知和语音特征的变化
经过8周的治疗,患者的认知功能得到整体改善,在CPT、DS和TMT上均有显著提高(效应量Hedges' g为0.43, 0.30, 0.29),但SC未见显著变化。同时,有99个语音参数发生了显著改变,效应量(Cohen's d)为负值,表明参数值在治疗后系统性降低,其中频谱特征和声学滤波器参数的变化最为突出,提示治疗可能改善了发声的共振和稳定性。
语音-认知动态的跨领域纵向关联
混合效应模型分析显示,基线语音特征的主成分(PC1)对TMT、CPT、DS的得分在8周内均有显著的纵向预测效应,即基线语音特征可以预测后续认知功能的变化轨迹。即使在模型中引入汉密尔顿抑郁量表(HAMD)分数作为协变量以控制抑郁严重程度的影响后,语音特征与认知的关联依然稳健,表明这种关联在一定程度上独立于情绪症状。
综上所述,这项研究有力地证明了语音声学特征,特别是频谱特征,与MDD患者的认知功能损伤密切相关,并且能够敏感地反映治疗带来的认知功能变化。研究结果表明,语音分析有潜力成为一种非侵入性、可扩展的客观工具,用于监测抑郁症患者的认知状态,为认知障碍的精准分型和干预时机选择提供了新的数字化思路。尽管本研究存在样本量有限、随访时间较短等局限性,但其开创性的纵向设计和多维分析方法为未来更大规模的研究奠定了基础。将语音这类易于获取的“数字表型”整合进临床评估体系,有望在未来改变精神疾病的诊疗模式,尤其适用于医疗资源匮乏的地区,具有重要的临床转化前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号