基于语音与自然语言标记物的双相情感障碍移动健康评估:一项前瞻性横断面研究

【字体: 时间:2025年07月02日 来源:JMIR Formative Research 2.0

编辑推荐:

  本研究针对双相情感障碍(BD)症状监测难题,创新性开发了整合声学特征与自然语言处理(NLP)技术的移动健康(mHealth)工具SPEAKapp。通过32例BD患者的横断面研究,发现语音延迟时间(ρ=0.152)、静默增加(ρ=0.416)与抑郁症状相关,而语速压力(ρ=-0.343)和声学不稳定参数(ρ=-0.19至-0.27)可预测躁狂症状。NLP特征对抑郁症状预测贡献显著(R2=0.25),为远程精神评估提供了新型数字化标记物。

  

在精神健康领域,双相情感障碍(Bipolar Disorder, BD)犹如一颗难以预测的"情绪炸弹",患者常在抑郁与躁狂状态间剧烈波动。传统临床评估依赖主观量表,存在回忆偏差和监测滞后问题,而语言障碍恰恰是BD发作的核心症状——躁狂期可能出现语速急促、内容夸张,抑郁期则表现为言语贫乏、应答延迟。这种独特的"语言指纹"能否成为客观监测的突破口?意大利Nord Milano Mental Health Trust的研究团队给出了创新解决方案。

研究人员开发了名为SPEAKapp的移动应用,通过智能手机录音采集32名BD患者的语音数据,结合Google Speech-To-Text API和Python语音分析工具包,提取了包括声学参数(基频F0、微扰指标jitter/shimmer)和NLP特征(词移动距离WMD、单词间平均时间)等42项数字化标记物。研究采用随机森林(Random Forest)模型,以蒙哥马利抑郁评定量表(MADRS)和Young躁狂评定量表(YMRS)为金标准进行验证。

【主要技术方法】
研究采用横断面设计,纳入32例经SCID-5确诊的BD患者,通过Babcock测试诱发连续性语音样本。使用Parselmouth库分析声学特征,采用词嵌入模型计算语义相似度,通过5折交叉验证构建预测模型。系统可用性通过SUS量表(平均73.5分)评估。

【结果发现】

  1. 声学-症状关联:抑郁症状与语音微扰参数(jitter)呈正相关(ρ=0.10-0.16),与基频标准差(F0 SD)关联显著;躁狂症状则与语速压力(平均单词间时间ρ=-0.34)负相关。
  2. 性别差异:女性抑郁症状与单词间时间相关性更强(ρ=0.75),男性声学特征预测价值更突出。
  3. 模型效能:NLP特征对抑郁症状预测优于声学特征(R2=0.25 vs 0.11),组合特征模型MSE为118.53。

【讨论与意义】
该研究首次证实智能手机采集的语音特征可量化反映BD症状严重度,其中:

  1. 时间动态特征(如语音延迟、静默比)是抑郁的敏感指标;
  2. 声学不稳定性与躁狂症状存在特异性关联;
  3. 性别差异提示需个性化建模。

发表于《JMIR Formative Research》的这项研究,为"数字表型"在精神疾病中的应用提供了范式。未来整合面部表情、运动特征的多模态评估系统,可能构建更精准的BD预警体系。但需注意文化语言差异、药物影响等混杂因素,通过纵向研究验证标记物的稳定性。这种低侵入性的远程监测工具,有望填补传统精神科评估的"时间盲区",为BD的精准管理开辟新途径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号