基于Transformer的心血管疾病风险预测模型TRisk:精准预防治疗的新突破

【字体: 时间:2025年06月17日 来源:The Lancet Digital Health 23.8

编辑推荐:

  针对传统心血管疾病(CVD)风险模型过度推荐治疗的问题,牛津大学团队开发了基于Transformer的TRisk模型。该研究利用英国291家诊所300万患者电子健康记录(EHR),在初级预防人群和糖尿病患者中验证显示,TRisk的C指数达0.910,较QRISK3减少34.6%不必要治疗推荐,为精准预防提供AI解决方案。

  

心血管疾病是全球首要死因,尽管降压和降脂治疗能有效预防,但如何精准识别高危个体仍是临床难题。传统统计模型如QRISK3和SCORE2依赖专家设计的有限变量,常导致过度治疗——在英国约1/3成年人被推荐用药,但多数人不会真正发病。更棘手的是,对糖尿病患者等高风险人群,现行指南简单采用"一刀切"治疗策略,忽视了显著的个体风险差异。这些低效的决策不仅浪费医疗资源,还增加患者不必要的药物负担。

牛津大学研究团队在《The Lancet Digital Health》发表突破性研究,开发了基于Transformer架构的TRisk(Transformer-based Risk assessment survival)模型。这项研究利用英国临床实践研究数据链(CPRD)中291家诊所1998-2015年间300万25-84岁成人数据,创新性地将自然语言处理技术应用于电子健康记录分析,在初级预防人群和糖尿病患者中实现了10年心血管疾病风险的精准预测。

研究采用三项关键技术:1)基于Transformer的生存分析框架,处理3858种诊断、390类药物等多模态时序EHR数据;2)实践级别的外部验证策略,使用独立98家诊所数据验证;3)迁移学习技术,将初级预防人群模型迁移至糖尿病队列微调。所有分析均遵循TRIPOD+AI报告规范。

研究结果:
【背景】系统回顾显示现有AI模型未能充分利用多模态EHR数据,TRisk首次实现基于Transformer的生存分析框架。
【方法】在2,971,777人队列中(中位随访2.5年),TRisk直接处理原始EHR序列,相比QRISK3和DeepSurv模型减少特征工程依赖。
【结果】TRisk展现出卓越判别力(C指数0.910,95%CI 0.906-0.913),较QRISK3提高9.5%。校准曲线显示所有模型在0-20%风险范围内表现良好。
【临床影响】在标准化1000人分析中,TRisk在15%阈值减少34.6%治疗推荐(178 vs 272人),同时将漏诊从9例降至8例。糖尿病患者应用10%阈值可减少24.3%治疗推荐,仅漏诊0.2%。
【亚组分析】TRisk在不同年龄层、性别和社会经济地位群体中表现稳定,对年龄依赖性显著低于传统模型。

讨论部分指出,TRisk的创新性体现在三方面:首先,模型通过分析完整EHR时序数据,突破传统风险评分依赖专家设计变量的局限;其次,迁移学习技术成功实现从普通人群到糖尿病患者的知识迁移;最后,决策曲线分析证实TRisk在所有临床相关阈值均具有净收益优势。值得注意的是,尽管未明确输入性别和社会经济数据,TRisk在这些亚组中展现出更均衡的表现,提示AI模型可能减少健康 disparities(差异)。

该研究的临床意义重大:在初级预防中,TRisk可减少约35%不必要的他汀类药物处方;对糖尿病患者,则首次实现基于个体风险的精准推荐。研究同时揭示了Transformer模型在捕获时序医疗数据中的独特优势,如自动识别传统模型忽略的风险因素(如缺铁性贫血)和时间依赖性关联。未来研究需在更多医疗系统中验证,并探索模型可解释性,但当前结果已为心血管疾病精准预防树立了新标杆。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号