基于自然语言处理模型的网络认知行为疗法疗效预测研究:文本交互与症状变量的协同作用分析

【字体: 时间:2025年10月12日 来源:Internet Interventions 3.6

编辑推荐:

  本研究针对网络认知行为疗法(ICBT)中患者-治疗师文本交互信息的预测价值展开探索。研究人员利用6613例患者的治疗文本与症状数据,训练TF-IDF、BERT及BELT三种自然语言处理(NLP)模型,评估其对治疗后症状的预测能力。结果显示,仅使用症状变量的线性回归模型预测效果最佳(BACC达70%),文本数据仅带来有限的预测增益。该研究为智能化心理治疗评估提供了重要数据支撑,并指出当前文本分析方法在临床预测中的局限性。

  
在全球精神健康问题日益严峻的背景下,传统心理治疗资源短缺与可及性不足成为突出矛盾。互联网提供的认知行为疗法(Internet-delivered Cognitive Behavioral Therapy, ICBT)因其低成本、高可及性和与传统面对面治疗相当的疗效,逐渐成为常规临床实践的重要组成部分。然而令人担忧的是,约30-60%的患者未能从ICBT中获得足够收益,这促使研究者不断探索个性化治疗的新途径。
预测治疗结果被视为实现个体化治疗调整的关键策略。早期研究表明,仅使用症状变量进行预测的模型可能达到67%的临床有用准确度。然而,这些模型大多忽视了治疗过程中一个核心要素——患者与治疗师之间的文本交流互动。ICBT的特殊优势在于其高度结构化的形式和基于文本的沟通方式,为构建大规模文本分析语料库提供了独特机会,这是传统面对面治疗难以实现的。
在此背景下,研究人员开展了一项创新性研究,旨在探索自然语言处理(Natural Language Processing, NLP)技术如何利用患者与治疗师之间的文本交互信息来预测ICBT的治疗效果。该研究不仅评估了纯文本模型的预测能力,还考察了文本数据与症状变量结合是否能带来预测准确度的提升。
研究人员从瑞典斯德哥尔摩互联网精神病学诊所2008年1月至2020年1月期间的6613例患者中收集数据,这些患者接受了12周针对重度抑郁障碍、恐慌症或社交焦虑障碍的ICBT治疗。研究团队使用了三种类型的NLP模型:术语频率-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)、来自变压器的双向编码器表示(Bidirectional Encoder Representations from transformers, BERT)以及用于更长文本的BERT(BERT for Longer Text, BELT)。这些模型在包含和不包含初期治疗阶段症状变量的两种情况下进行训练,以预测治疗后症状。研究采用多重插补处理缺失数据,并使用嵌套交叉验证方法确保结果的可靠性。
关键技术方法包括:使用来自瑞典斯德哥尔摩互联网精神病学诊所6613例ICBT患者的182,698条医患消息文本数据;采用TF-IDF、BERT和BELT三种NLP模型架构;结合症状变量进行多模态预测;使用多重插补处理缺失数据;采用嵌套交叉验证进行模型验证。
研究方法方面,研究使用了前瞻性预测设计,利用常规护理诊所的观察数据,包括治疗师与患者之间的通信内容。主要连续结果指标包括蒙哥马利-阿斯伯格抑郁评定量表自评版(MADRS-S)、恐慌症症状量表自评版(PDSS-SR)和Liebowitz社交焦虑量表自评版(LSAS-SR)。文本数据包含治疗前28天内患者与治疗师之间的消息交流,总计68,094条消息。
模型构建与验证方面,研究使用了虚拟回归器(Dummy Regressor, DR)作为零模型,线性回归(Linear Regression, LR)作为仅使用症状变量的基准方法。TF-IDF使用弹性网络回归(Elastic Net regression, EN),被视为基线NLP模型。BERT模型基于大型瑞典数据集进行预训练,随后在研究数据集上进行微调。BELT模型则通过添加滚动窗口扩展了BERT的能力,以处理更长的文本序列。
结果部分显示,症状仅模型表现最佳。在预测症状结果方面,线性回归模型获得了最佳的均方根误差(Root Mean Squared Error, RMSE)为0.14和平衡准确率(Balanced Accuracy, BACC)为70%。在NLP模型中,只有BERT模型的表现优于虚拟模型,其RMSE为0.17,而虚拟模型的RMSE为0.18。添加症状变量到BERT模型中显著提高了其准确度,但RMSE指标未见改善。最佳线性回归基准模型的F1分数为0.66,优于BERT模型的0.55,而结合BERT和症状的模型达到0.62。
模型比较结果显示,线性回归模型在BACC方面显著优于虚拟模型、TF-IDF模型、TF-IDF结合症状模型、BERT模型、BELT模型和BELT结合症状模型。这表明在使用症状变量的简单模型面前,即使是最先进的NLP模型也难以提供额外的预测价值。
文本数据分析显示,患者与治疗师在治疗前28天内的平均交流字数为3194字(标准差为2053),消息发送时间分布除治疗开始时有明显增加外,在整个治疗期间没有明显模式。
讨论部分指出,线性回归模型具有最佳的平均预测性能。在NLP模型中,只有BERT模型的表现优于零模型,并且是唯一一个在添加症状变量后性能有所提升的模型,但这仅体现在BACC指标而非RMSE指标上。模型之间的性能差异很小,RMSE相差0.02-0.04相当于症状量表总分的2-4%差异,这在临床上被认为是最小差异,不具有临床意义。
研究局限性包括使用少量插补数据集可能影响估计精度,计算复杂性限制了超参数探索的范围,特别是BELT模型受到内存限制的影响。此外,模型同时考虑了患者和治疗师的交流内容,未来研究可以专注于对话的某一部分,或者使用时变模型来提高预测价值。
结论部分强调,患者与治疗师之间的文本内容可以对治疗后症状结果产生预测作用,但这种预测能力似乎很小,文本摘录与几周后自评症状之间的关系较弱。训练一个同时考虑患者-治疗师文本和同时期自评症状的模型可以加强预测,但可能不会超过仅使用症状变量的效果。这些结果丰富了使用ICBT中患者-治疗师文本来预测自评治疗后症状结果的有限文献。虽然患者-治疗师对话是治疗的一个组成部分,但其对预测的相关性仍然难以评估。
该研究的重要意义在于为智能化心理治疗评估提供了实证基础,指出了当前文本分析技术在临床预测中的应用局限,并为未来研究指明了方向。语言模型在除了前瞻性预测之外的许多潜在应用,未来关于患者-治疗师对话的研究可以探索诸如自动目标制定和治疗行为功能分析等途径。
这项研究发表在了《Internet Interventions》期刊上,为数字心理健康领域的发展提供了重要的科学依据,也为后续更精细化的文本分析和预测模型开发奠定了坚实基础。随着计算能力的提升和数据集的扩大,基于NLP的疗效预测模型有望在未来为个性化心理治疗提供更加精准的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号