基于机器学习的系统性红斑狼疮公平性预测模型FLAME:整合临床与社会健康决定因素的多中心研究

【字体: 时间:2025年07月28日 来源:JAMIA Open 2.5

编辑推荐:

  本研究针对系统性红斑狼疮(SLE)患者疾病活动度预测的临床挑战,开发了名为FLAME的机器学习预测模型。研究人员整合电子健康记录(EHR)和675项社会健康决定因素(SDoH),通过XGBoost算法实现3个月发作风险的公平预测(AUROC=0.66)。该模型首次证实头痛、器质性脑综合征和脓尿是关键预测因子,并通过因果学习揭示社会因素与临床指标的交互作用,为消除健康差异提供了可解释的AI工具。

  

系统性红斑狼疮(SLE)作为一种慢性自身免疫性疾病,长期困扰着全球患者群体,尤其对女性和少数族裔造成不成比例的疾病负担。这种以免疫系统攻击自身组织为特征的疾病,常伴随不可预测的病情恶化(称为"发作"),给临床管理带来巨大挑战。更令人担忧的是,现有研究表明非西班牙裔黑人患者的发病率是白人群体的4倍,而传统预测模型往往忽视社会因素对疾病的影响,可能加剧医疗不平等。在这个背景下,准确预测发作风险成为改善患者预后的关键突破口。

来自佛罗里达大学健康结果与生物医学信息学系(Department of Health Outcomes and Biomedical Informatics, University of Florida)的Yongqiu Li和Lixia Yao领衔的研究团队,联合宾夕法尼亚大学、亚利桑那大学等8所机构,开展了一项突破性研究。他们开发了名为FLAME(FLAre Machine learning prediction of SLE)的机器学习管道,通过整合28433例患者的电子健康记录和675项社区级社会健康决定因素(SDoH),建立了首个兼顾预测性能与公平性的发作风险模型。这项开创性工作发表在医学信息学领域权威期刊《JAMIA Open》上。

研究团队采用多学科交叉方法,核心技术创新体现在三个层面:首先,利用UF Health系统2011-2022年的临床数据构建回顾性队列,通过SLEDAI-2K评分(Systemic Lupus Erythematosus Disease Activity Index 2000)量化发作事件(定义为评分较基线增加≥4分);其次,采用XGBoost和逻辑回归算法,结合网格搜索交叉验证优化参数,并应用SHAP(SHapley Additive exPlanations)和MGM-PC-Stable因果学习技术解析预测机制;最后,引入机会平等指标(equality of opportunity)评估模型在不同种族/族裔群体中的公平性。

描述性统计与队列特征
研究纳入的28433例SLE患者平均诊断年龄46.3岁,女性占89.38%,体现疾病性别分布特征。基线SLEDAI-2K评分平均1.14±2.77,3个月随访期间18.42%患者出现发作。种族分析显示非西班牙裔白人(NHW)占39.1%,非西班牙裔黑人(NHB)26.29%,西班牙裔26.36%,各组间临床特征存在显著差异(P<0.001)。头痛(19.8%)、皮疹(17.47%)和脓尿(13.69%)是最常见的临床表现。

FLAME预测模型性能

可解释AI与因果发现

时间动态与公平性验证
图4的桑基图显示头痛和器质性脑综合征在发作前3-6个月持续上升。公平性评估中,非西班牙裔黑人与白人间的假阴性率比(FNR)为0.91,西班牙裔与白人间为1.04,均落在公平区间(0.8-1.25)内,证明模型无显著种族偏差。

这项研究通过创新性地整合多维度数据,建立了首个经公平性验证的SLE发作预测系统。FLAME模型不仅证实头痛等临床症状的预测价值,更揭示社会因素通过复杂网络影响疾病活动的机制。其临床意义体现在三方面:首先,风险分层能力使33%的高危患者在发作前被识别;其次,因果推理框架为针对性干预提供新靶点;最后,公平性设计确保技术红利惠及所有人群。尽管存在依赖诊断代码和缺乏个体级SDoH等局限,这项研究为自身免疫病的精准管理树立了新范式,其方法论对慢性病预测领域具有广泛借鉴价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号