基于Transformer模型结合社会行为健康决定因素和自然语言处理预测退伍军人精神科出院后自杀死亡

《Scientific Reports》:Predicting suicide death among veterans after psychiatric hospitalization using transformer based models with social determinants and NLP

【字体: 时间:2025年11月29日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对退伍军人精神科出院后自杀风险预测难题,创新性地将社会行为健康决定因素(SBDH)与Transformer深度学习模型相结合。研究人员通过提取ICD编码和临床文本中的SBDH特征,构建了TransformEHR预测模型,结果显示SBDH显著提升模型预测性能(AUROC提升4.7%),并改善了不同性别群体间的预测公平性。该研究为精准预防自杀提供了新范式。

  
自杀是一个严重的公共卫生问题,对个人、家庭和社区产生深远影响。在美国,2020年就有近4.6万人死于自杀。退伍军人的自杀风险尤为突出,其自杀率是非退伍军人成年人的1.4倍。精神科出院后的患者(PDPH)是自杀的高危人群,因此,准确预测这类人群的自杀风险对于实施有针对性的干预措施至关重要。
目前,自杀风险预测模型主要依赖于电子健康档案(EHR)中的结构化数据,例如诊断编码(ICD代码)和人口统计学信息。然而,社会行为健康决定因素(SBDH),如失业、住房不稳定、食品无保障、社会孤立等,已被证明与自杀行为密切相关。但传统的结构化EHR在捕捉SBDH方面往往不完整,大量的SBDH信息隐藏在临床医生的非结构化文本记录(即临床笔记)中。这引出了一个关键问题:从非结构化文本中提取的SBDH信息,能否提升自杀风险预测模型的性能?此外,不同的预测模型(如传统的集成机器学习模型与先进的深度学习模型)在整合SBDH后表现如何?这些模型在不同人口统计学群体(如不同性别)中的预测是否公平?这些问题尚未得到充分探索。
为了回答这些问题,由Zhichao Yang、Avijit Mitra、Wen Hu、Dan Berlowitz和Hong Yu(通讯作者)组成的研究团队在《Scientific Reports》上发表了一项研究,题为“Predicting suicide death among veterans after psychiatric hospitalization using transformer based models with social determinants and NLP”。该研究利用美国退伍军人健康管理局(VHA)的大规模数据,深入探讨了结合SBDH和自然语言处理(NLP)技术的Transformer模型在预测退伍军人精神科出院后自杀死亡方面的有效性、公平性和校准性。
主要技术方法概述
本研究基于美国退伍军人健康管理局(VHA)的414,043例精神科住院出院数据构建回顾性队列。研究团队从结构化EHR(如ICD-10诊断与操作代码、CPT代码、药物代码)和非结构化临床笔记中提取了数万个预测变量。关键创新在于使用NLP系统从临床笔记中自动提取了11类SBDH(如社会孤立、经济困难、住房不稳定等)及其状态(当前、历史等)。同时,结合了区域剥夺指数(ADI)来衡量社区层面的社会经济劣势。研究采用了两类核心预测模型进行对比:一种是集成多种传统机器学习算法(如逻辑回归、梯度提升)的模型,另一种是名为TransformEHR的基于Transformer的深度学习模型,该模型专为处理纵向EHR事件而设计。模型性能通过AUROC(受试者工作特征曲线下面积)、灵敏度(SN)、阳性预测值(PPV)和预期校准误差(ECE)等指标进行评估,并特别分析了模型在不同性别和种族亚组中的表现以评估公平性。
研究结果
总体预测结果
研究发现,加入SBDH能显著提升模型的预测性能。具体而言,与仅使用管理数据(基线模型)相比,加入ICD编码的SBDH(SBDH1)使集成模型的AUROC提升了3.1%,使TransformEHR模型的AUROC提升了2.9%。进一步加入从临床笔记中通过NLP提取的SBDH(SBDH2)后,集成模型和TransformEHR模型的AUROC又分别提升了1.7%和1.8%。最终,结合了所有预测因子(管理数据、人口统计学、ICD-based SBDH、NLP-extracted SBDH)的TransformEHR模型取得了最佳性能,AUROC达到64.04%。此外,TransformEHR模型的校准效果(ECE=0.014)优于集成模型(ECE=0.025),表明其预测概率更可靠。
自杀预测的操作特性
研究评估了最佳模型(TransformEHR with SBDH)在不同预测时间窗(7天、30天、90天、180天)和不同决策阈值下的表现。例如,当对预测风险最高的5%的患者进行干预时,模型能捕捉到34.0%至45.3%的实际自杀者(灵敏度)。阳性预测值(PPV)随着预测时间窗的延长而增加,在180天窗、5%阈值下达到1.6%,这意味着每干预100名被模型判定为高风险的出院患者,约有1.6人会在未来180天内死于自杀。虽然PPV绝对值看起来不高,但考虑到自杀是罕见事件,且与主动筛查问卷相比,该方法成本极低,仍具有重要的潜在应用价值。
不同社会人口学特征下的性能
鉴于研究队列中男性占主导(92%),模型在不同性别间的公平性是评估重点。结果显示,TransformEHR模型在男性和女性中的AUROC均显著高于集成模型。更重要的是,加入SBDH后,两种模型在女性患者中的性能提升幅度(集成模型提升6.3%,TransformEHR提升5.9%)均大于男性(集成模型提升4.7%,TransformEHR提升4.8%),缩小了性别间的性能差距,表明SBDH的加入有助于提高模型的公平性。在不同种族亚组中,SBDH同样带来了性能提升,尤其是在代表性不足的群体(如亚裔)中提升更为明显,且模型在不同种族间的性能差异无统计学意义。
讨论与结论
本研究首次系统评估了SBDH,特别是通过NLP从临床笔记中提取的SBDH,在提升自杀死亡预测性能、校准度和公平性方面的作用。研究结果明确显示,SBDH是自杀风险预测的重要补充因素。TransformEHR这一深度学习模型展现出优于传统集成模型的性能,其在处理纵向EHR数据和学习复杂特征表示方面的优势,可能有助于更准确地捕捉与自杀相关的细微模式。
研究的实际意义在于,它为开发低成本、可扩展的自动化自杀风险筛查工具提供了证据支持。通过被动分析现有的EHR数据,该系统可以识别出高风险个体,从而使得有限的干预资源(如强化的出院后个案管理项目)能够更精准地投放。即使PPV相对较低,但考虑到干预可能同时惠及那些虽未死于自杀但存在严重精神症状的患者,其总体效益可能是积极的。
当然,研究也存在一些局限性。例如,数据主要来源于VHA系统,患者以男性为主,这限制了在其他人群中的泛化性。NLP提取SBDH的准确性(F1分数0.78)仍有提升空间,未来可探索使用大语言模型(LLMs)来改进提取效果。此外,需要进行外部验证以确保模型在VHA以外的医疗系统中的有效性。
综上所述,这项研究有力地证明了将社会行为健康决定因素整合到电子健康记录分析中,能够显著改善对退伍军人精神科出院后自杀风险的预测。它不仅提升了预测的准确性,还朝着更公平、更可靠的临床决策支持工具迈出了重要一步,为利用人工智能和大数据预防自杀开辟了新的途径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号