利用数字表型识别创伤后应激障碍患者中的述情障碍个体:一项横断面研究
《JMIR Mental Health》:Using Digital Phenotypes to Identify Individuals With Alexithymia in Posttraumatic Stress Disorder: Cross-Sectional Study
【字体:
大
中
小
】
时间:2025年11月16日
来源:JMIR Mental Health 5.8
编辑推荐:
退伍军人PTSD患者通过面部、声音和语言特征构建的机器学习模型可准确识别alexithymia(F1=0.78,AUC=0.87),支持多模态数字表型在临床筛查中的应用。
本研究聚焦于战后退伍军人中的一种心理机制——alexithymia(情绪识别与描述困难),并探讨了如何通过面部、语音和语言的数字表型(digital phenotypes)来识别这一机制。Alexithymia被定义为个体在识别和描述自身情绪状态方面存在困难,通常伴随着对外部环境的关注而非内在感受的探索。这种心理机制被认为与多种精神疾病,如创伤后应激障碍(PTSD)密切相关,且可能影响疾病的病程、严重程度以及治疗效果。因此,准确测量和识别alexithymia在临床情境中具有重要意义。然而,目前大多数相关研究依赖于自我报告量表,如Toronto Alexithymia Scale-20(TAS-20),这可能受到自我报告偏差的影响,且对于涉及自我意识缺陷的alexithymia测量来说不够理想。基于此,研究者尝试采用机器学习方法,结合面部、语音和语言的数字表型特征,来评估其在识别alexithymia方面的潜力。
在研究设计上,研究人员招募了96名患有PTSD的澳大利亚国防军退伍军人,通过1分钟的录音记录他们描述创伤事件的过程。这些录音被用于提取多维度的数字表型特征,包括面部表情、语音特征和语言使用模式。研究使用了XGBoost机器学习模型,结合五折嵌套交叉验证方法,以评估模型在区分具有alexithymia和非alexithymia个体方面的准确性。研究结果显示,该模型在识别具有alexithymia的个体方面表现良好,平均F1分数为0.78,平均AUC(曲线下面积)为0.87。这一结果表明,通过数字表型数据进行分类在一定程度上是可行的,并且能够提供可靠的识别手段。
面部、语音和语言表型在模型中均发挥了重要作用。例如,面部表情的分析基于面部动作编码系统(FACS),通过测量面部肌肉活动的强度来识别情绪状态。研究发现,平均嘴部张开程度是面部特征中最具预测性的指标之一,这可能反映了个体在描述创伤事件时的情绪表达方式。语音特征方面,研究利用了Parselmouth工具,分析了基本频率、音量、抖动(jitter)和震颤(shimmer)等参数。此外,模型还考虑了更复杂的语音特征,如梅尔频率倒谱系数(MFCC)的方差和声谱峰突出度(CPP)的波动情况。语言特征则通过WhisperX将语音转换为文本,并结合自然语言处理工具如Valence Aware Dictionary and Sentiment Reasoner进行分析,提取了与情绪相关的词汇使用、语言情感倾向以及第一人称代词的使用频率等信息。这些多维度的特征共同构成了模型的输入,从而提升了分类的准确性。
在研究方法中,参与者被要求详细描述最影响他们的创伤事件,并在描述过程中进行情绪评分。这些数据被用于训练和测试机器学习模型,以评估其在识别alexithymia方面的性能。研究采用了五折嵌套交叉验证方法,以减少模型训练过程中可能出现的偏差,并提高结果的稳健性。同时,研究人员对模型的性能指标进行了详细分析,包括精确度(precision)、召回率(recall)、F1分数和AUC值。其中,F1分数被选为评估模型性能的主要指标,因为它能够更好地平衡精确度和召回率,尤其适用于类别不平衡的情况。研究结果表明,尽管模型在识别具有alexithymia的个体方面表现良好,但在精确度方面仍存在一定局限,这可能与样本中alexithymia个体数量较多有关。
此外,研究还探讨了数字表型在临床应用中的潜力。与传统的自我报告量表相比,基于数字表型的识别方法具有非侵入性、客观性和可扩展性等优势。这种方法能够减少个体主观因素对测量结果的影响,同时也能更全面地捕捉个体在情绪表达方面的细微差异。例如,某些具有alexithymia的个体可能在语言表达上表现出较少的情绪词汇使用,或在语音特征上表现出异常的波动,而这些特征可能无法通过自我报告量表准确捕捉。因此,通过结合多种数字表型特征,研究者能够更有效地识别alexithymia,从而为临床干预提供更精准的依据。
研究的局限性同样值得关注。首先,样本量较小(N=96),这可能会影响模型的泛化能力。其次,样本中男性占大多数(81%),这可能限制了研究结果在其他人群(如女性或非军事背景的个体)中的适用性。此外,类别不平衡问题也可能影响模型的性能,因为具有alexithymia的个体数量远多于非alexithymia的个体。尽管研究者采用了嵌套交叉验证方法来缓解这一问题,但模型在某些折叠中仍表现出较低的稳定性。这些局限性提示未来的研究需要进一步扩大样本量,并考虑使用更复杂的算法或数据增强技术来提高模型的准确性和鲁棒性。
从研究结果来看,面部、语音和语言表型在识别alexithymia方面均发挥了重要作用,这与alexithymia的理论模型——关注与评估模型(attention-appraisal model)——相吻合。该模型认为,alexithymia个体在面对刺激时,难以将注意力集中在自身情绪反应上,且无法有效评估这些情绪。因此,他们在情绪表达方面可能表现出不同的特征,如较少使用情绪词汇、语音波动异常或面部表情不够丰富。这些特征不仅有助于识别alexithymia,也为理解其在PTSD等心理疾病中的作用提供了新的视角。
在临床应用方面,基于数字表型的识别方法具有广阔前景。例如,通过分析个体在描述创伤事件时的语言表达、语音特征和面部表情,医生可以更快速地判断其是否具有alexithymia,从而制定更个性化的治疗方案。这种方法不仅可以提高诊断的效率,还能够减少对传统自我报告量表的依赖,从而避免可能的偏差。此外,数字表型分析技术的非侵入性和自动化特性,使其在大规模筛查和长期跟踪研究中具有显著优势。例如,在PTSD患者的治疗过程中,医生可以利用这些数据来评估治疗效果,并及时调整干预策略。
然而,尽管研究结果令人鼓舞,但这一方法仍需进一步验证。目前,研究仅在特定样本中进行了测试,未来需要在更广泛的样本中进行重复验证,以确保模型的稳定性和可靠性。此外,研究者还需要考虑如何将这些技术整合到现有的临床评估流程中,以确保其在实际应用中的可行性和有效性。例如,开发用户友好的软件工具,使医生能够轻松获取和分析这些数据,同时确保数据的隐私和安全。
总体而言,本研究为识别alexithymia提供了一种新的方法,并表明面部、语音和语言表型在机器学习模型中具有重要价值。尽管存在一些局限性,但这些结果为未来的临床研究和实践提供了重要的启示。通过进一步优化模型和扩大样本量,基于数字表型的识别方法有望成为一种有效的工具,帮助医生更准确地评估和干预具有alexithymia的PTSD患者。这一研究不仅推动了对alexithymia机制的理解,也为心理健康领域的数字化转型提供了新的思路和方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号