解锁电子健康记录 “密码”:NLP 助力 SBDH 提升退伍军人自杀预测精度

【字体: 时间:2025年02月23日 来源:npj Mental Health Research

编辑推荐:

  为解决自杀预测中 SBDH 利用不足的问题,美国相关研究人员开展从结构化和非结构化数据提取 SBDH 用于退伍军人自杀预测的研究。结果显示该方法可提升模型性能,对推进自杀预测意义重大,值得科研读者一读。

  
在当今社会,自杀问题如同笼罩在人们心头的阴影,挥之不去。在美国,几十年来,自杀一直稳居主要死因之列。从 2000 年到 2021 年,自杀率大幅攀升了 35.6% 。仅在 2021 年,美国就有 48183 人因自杀离世,而全球每年因自杀失去生命的人数更是超过 70 万。在这一严峻形势下,退伍军人的自杀问题尤为突出。过去十年间,退伍军人的自杀率明显高于非退伍军人,而且他们自杀风险的增长速度更快。

面对如此紧迫的问题,医疗保健提供者们肩负着重大责任。毕竟,有研究发现,80% 的自杀受害者在离世前一年曾与初级医疗保健提供者有过接触,25.7 - 31% 的人还寻求过心理健康护理。这意味着,如果能有更精准的自杀预测工具,就能帮助医护人员提前发现高风险人群,采取有效措施降低自杀风险。

社会和行为决定健康因素(SBDH),像社会经济地位、获取健康食物的途径、教育水平、住房状况等,对人们的健康有着深远影响,而且它们与自杀行为之间也存在着紧密联系。比如,社会关系破裂、经济不稳定、法律纠纷以及童年时期的不良经历等,都和自杀行为密切相关。然而,以往利用 SBDH 来预测自杀却困难重重。这是因为传统的结构化数据来源,像 ICD 代码,在捕捉全面、可靠的 SBDH 信息方面存在很大局限。虽然非结构化的临床记录中蕴含着丰富的 SBDH 信息,但却一直未得到充分利用。

与此同时,电子健康记录(EHR)在美国的广泛应用,为自杀风险预测带来了新的契机。研究人员开始尝试运用数据挖掘和机器学习等方法,利用 EHR 数据来预测患者的自杀行为和自杀死亡率。不过,大多数相关研究都聚焦于结构化数据,非结构化的 EHR 记录这一宝贵的数据资源却被忽视了。随着先进的自然语言处理(NLP)技术的出现,从 EHR 记录中自动提取 SBDH 信息变得可行,这有望为自杀风险预测提供更全面的依据。

美国退伍军人事务部(VA)拥有庞大的综合医疗保健网络和全国性的 EHR 系统,为自杀相关预测模型的研究提供了丰富的数据资源。基于这样的背景,美国相关研究人员在《npj Digital Medicine》期刊上发表了题为 “Natural language processing–extracted social and behavioral determinants of health improve suicide prediction among US Veterans” 的论文。他们通过研究发现,将结构化和 NLP 提取的 SBDH 纳入自杀预测模型,能够显著提升模型的性能。这一研究成果为自杀预防领域带来了新的希望,有望推动更有效的自杀预防系统的发展。

在这项研究中,研究人员主要运用了以下几种关键技术方法:首先,他们从美国退伍军人事务部的企业数据仓库中获取了大量的住院和门诊出院数据,这些数据涵盖了 2009 年 10 月 1 日至 2015 年 9 月 30 日期间的信息。接着,他们将所有预测因素分为人口统计学、代码、自杀行为(SB)信息和 SBDH 这四类。其中,SBDH 信息一部分从结构化数据中提取,另一部分则借助基于变压器的 NLP 系统从非结构化临床记录中获取。之后,他们采用了弹性网络逻辑回归(ENL)、随机森林(RF)和多层感知器(MLP)这三种不同的机器学习方法进行预测建模,并通过 10 折交叉验证和网格搜索等方式优化模型的超参数。最后,他们运用多种性能指标,如受试者工作特征曲线下面积(ROC AUC)、精确召回曲线下面积(PR AUC)等,来评估模型的预测性能 。

下面来看看具体的研究结果:

  • 自杀的发生率:研究人员对 2987006 名退伍军人的 17267304 次出院记录进行分析后发现,在 7 天预测窗口内,出院层面的自杀率为 0.005%,患者层面的自杀率为 0.03%;在 180 天预测窗口内,出院层面的自杀率为 0.05%,患者层面的自杀率为 0.27%。不同预测窗口的病例对照队列包含的出院记录数量各不相同,7 天的有 5094 次,30 天的有 14256 次,90 天的有 29580 次,180 天的有 46668 次。
  • 整体模型性能:研究人员发现,随着新的预测因素组的加入,几乎所有模型和预测窗口的性能都有所提升。比如,在 7 天预测窗口中,为弹性网络逻辑回归(ENL)模型添加代码预测因素后,PR AUC 提升了 47.66% ,再加入 SB 预测因素后,又进一步提升了 23.13% ,加入 SBDH 预测因素后,还能提升 2.78% 。不同模型在不同预测窗口的表现各有优劣,ENL 在 7 天和 30 天预测窗口中 AUC 得分表现出色,而 RF 在 90 天和 180 天预测窗口中更胜一筹。而且,预测窗口越长,模型的表现往往越好,门诊急诊出院记录的 AUC 得分通常高于住院出院记录。在最佳预测因素配置下,这些模型在 5% 风险层级、96.75 - 98.88% 特异性的情况下,能够检测出 12.98% - 24.58% 的自杀死亡案例。
  • NLP 提取的预测因素的影响:研究人员对比了 NLP 提取的 SBDH、结构化 SBDH 以及两者结合的 SBDH 对模型性能的影响。结果发现,在 50% 的情况下(12 种设置中有 6 种),NLP 提取的 SBDH 表现最佳,而结构化 SBDH 在 4 种设置中表现更优。以 7 天预测窗口为例,ENL 和 RF 模型在加入 NLP 提取的 SBDH 作为预测因素后,PR AUC 分别提升了 2.78% 和 8.79% ;在 180 天预测窗口中,这两个模型的 PR AUC 分别提升了 0.70% 和 4.34% 。不过,对于 MLP 模型来说,加入 SBDH 预测因素并不总是能带来显著的性能提升。
  • 校准和预测因素重要性:在三个模型中,RF 模型的校准效果最好。通过 Kernel SHAP 方法分析预测因素的重要性后发现,自杀未遂(SA)、自杀意念(SI)以及 79 岁及以上年龄组是不同模型和预测窗口中最常见的正向预测因素;黑人种族、女性性别和 50 - 59 岁年龄组则是最常见的负向预测因素。在 SBDH 相关预测因素中,“社会隔离”(NLP 提取)和 “暴力”(结构化)是最常见的正向预测因素。
  • 集成学习:研究人员采用线性平均的方法进行集成学习,将不同模型的预测结果进行整合。结果发现,将 ENL 和 RF 模型集成后,在 7 天、30 天和 90 天预测窗口中的 AUC 得分比单个最佳模型有所提升,但在 180 天预测窗口中性能并未改善。整体来看,RF 模型的校准效果依然优于集成系统。

综合研究结果和讨论部分,这项研究意义重大。它首次通过病例对照研究,深入探讨了 NLP 提取的 SBDH 在预测美国退伍军人自杀风险方面的作用。研究表明,包含 SBDH 预测因素的模型在 AUC 得分上明显优于不包含 SBDH 的模型,而且 NLP 提取的 SBDH 在大多数情况下表现出色。这充分证明了利用 NLP 技术从临床记录中提取 SBDH 信息,能够丰富自杀预测模型的信息,提升模型的预测性能。

不过,研究也存在一些局限性。比如,研究数据来自 VA 系统,其人口结构与美国总体人口有差异,而且数据存在一定局限性;研究结果在不同时间的通用性可能受到多种因素影响;研究仅关注了门诊急诊和住院护理出院情况,观察窗口也相对较短;在评估自杀预测模型时,研究未采用净效益(NB)等更合适的指标,并且使用的社会经济变量也有一定局限性。但这些不足也为后续研究指明了方向。

总的来说,这项研究为自杀预防领域开辟了新的道路。它让我们看到了 NLP 技术在自杀风险预测中的巨大潜力,为构建更有效的自杀预防系统提供了有力的理论和实践依据。未来,研究人员可以针对这些局限性进一步开展研究,不断完善自杀预测模型,从而更好地预防自杀行为的发生,拯救更多的生命。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号