基于大语言模型的多种长期共病群体聚类分析:一项基于人群的电子健康记录研究

【字体: 时间:2025年07月19日 来源:npj Digital Medicine 12.4

编辑推荐:

  本研究针对多种长期共病(MLTC)临床异质性高的难题,创新性地开发了EHR-DeBERTa模型,通过分析英国580万患者的电子健康记录(EHR)时序数据,首次实现了基于Transformer架构的性别特异性患者聚类。研究识别出15个女性集群和17个男性集群,涵盖低疾病负担、心理健康、心脏代谢等五大类型,揭示了疾病发展的时序规律和人口统计学差异,为精准医疗提供了新范式。

  

在当今老龄化社会中,多种长期共病(Multiple Long-Term Conditions, MLTC)已成为全球公共卫生的重大挑战。据统计,超过四分之一的成年人同时患有两种以上慢性疾病,这些患者不仅面临更差的健康结局和生活质量,还承受着"看病马拉松"的困扰——需要频繁往返于不同专科门诊之间。然而,现有医疗体系仍以单病种管理为核心,这种"头痛医头、脚痛医脚"的模式显然难以满足MLTC患者的复杂需求。更棘手的是,MLTC的临床表现千差万别,不同疾病组合可能涉及完全不同的病理机制和治疗方案,这就像试图用同一把钥匙打开成千上万把不同的锁。

传统研究多采用横断面设计,将疾病视为静态共存的状态,忽略了疾病发展的时间维度。这好比只看一张照片就判断整部电影的情节,显然会丢失关键信息。此外,既往聚类方法多基于疾病共现频率,未能充分利用电子健康记录(EHR)中丰富的时序信息和多模态临床数据。这些局限性促使来自Imperial College London等机构的研究团队另辟蹊径,将自然语言处理领域的最新进展引入医学研究。

研究人员创新性地开发了EHR-DeBERTa模型架构,通过分析英国临床实践研究数据链(CPRD)中580万患者的纵向EHR数据,包括诊断代码、用药记录和实验室检查结果等3776种临床事件。研究采用DeBERTa v3的ELECTRA式预训练结合DiffCSE对比学习,生成768维患者嵌入向量,再通过K-means聚类识别出性别特异的疾病模式。所有分析均基于2019年12月31日前注册的全科诊所患者数据,包含54种慢性病和3个危险因素。

研究结果部分通过多个维度揭示了MLTC的复杂图谱:

患者聚类特征
研究识别出15个女性集群和17个男性集群,可分为五大类型:低疾病负担型(女性20.3%,男性14.6%)、心理健康型(女性35.6%,男性19.9%)、心脏代谢型(女性18.8%,男性34.6%)、呼吸系统型和混合型。值得注意的是,心理健康与心脏代谢集群呈现"此消彼长"的特点——前者以中年人群为主(女性中位年龄60岁,男性59岁),后者则集中在老年群体(女性83岁,男性74岁)。

疾病分布规律
心脏代谢集群CM1展现出多系统受累特征,包含心血管疾病、慢性肾病(CKD)、COPD和痴呆等多种并发症。心理健康集群MH1则呈现"精神-神经-代谢"共病模式,焦虑、抑郁与药物滥用、肥胖等并存。研究还发现一些非典型关联,如炎症性肠病(IBD)与呼吸系统疾病的共现,骨质疏松与痴呆的关联等。

社会人口学差异
南亚裔男性在糖尿病、痛风、肥胖为主的CM1集群中过度代表(标准化Z值>50),而黑人男性在糖尿病、高血压、CKD为主的CM6集群中更为集中。低疾病负担集群在富裕地区比例显著高于预期(Z值<-50),揭示了健康不平等问题。

方法学比较
与传统潜在类别分析(LCA)相比,EHR-DeBERTa生成的集群更均衡且临床可解释。LCA产生的最大集群包含31.4%男性患者,主要特征仅为"哮喘、抑郁和高血压",难以体现MLTC的异质性。

这项发表于《npj Digital Medicine》的研究具有多重重要意义:在方法论层面,首次证明Transformer架构可有效捕捉疾病发展的时序规律,EHR-DeBERTa对197个临床公认共病对的余弦相似度达0.58,显示出优异的临床相关性识别能力。在临床实践层面,研究为"以患者为中心"的整合式医疗提供了路线图,建议对心脏代谢等强聚类疾病实施多学科联合诊疗。在公共卫生层面,研究揭示了非白人群体和低收入人群更早发生MLTC的规律,为针对性干预提供了依据。

研究也存在若干局限:癌症等疾病在初级保健记录中的完整性可能不足;仅57%患者有民族信息记录;模型未纳入连续型检验指标。未来研究可结合医院数据验证发现,并探索集群与临床结局的关联,进一步推动MLTC的精准防治。正如研究者所言:"识别这些集群就像绘制医学星图——不仅让我们看清疾病间的引力关系,更为导航复杂的多病共存宇宙提供了坐标系。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号