基于公平正例无标签学习的阿尔茨海默病预测模型:在多样化电子健康记录中实现公平诊断

《npj Digital Medicine》:Fair positive unlabeled learning for predicting undiagnosed Alzheimer’s disease in diverse electronic health records

【字体: 时间:2025年11月28日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对阿尔茨海默病(AD)在真实世界中的诊断不足及种族差异问题,开发了半监督正例无标签学习(SSPUL)框架,结合种族偏差缓解技术,从UCLA Health电子健康记录(EHR)中预测未确诊AD。结果显示,SSPUL在非西班牙裔白人、非西班牙裔非洲裔美国人、西班牙裔拉丁裔和东亚人群中的敏感性(0.77-0.81)和精确召回曲线下面积(AUCPR)(0.81-0.87)均显著优于监督基线模型,且表现出最优的公平性(最低累积均等损失)。通过多基因风险评分(PRS)验证,预测阳性组的遗传风险显著高于阴性组(p<0.001)。该研究为改善AD早期诊断、减少种族差异提供了创新方法。

  
阿尔茨海默病(Alzheimer's Disease, AD)作为最常见的神经退行性疾病,已成为美国第六大死因,约每9位老年人中就有1人受其影响。2023年,AD及相关痴呆的治疗总成本高达3450亿美元,预计到2050年将突破1万亿美元。尽管疾病负担沉重,AD在真实世界中的诊断率却严重不足——基于医疗保险索赔数据的诊断敏感性仅为50-65%,远低于金标准诊断。这一诊断缺口在 underrepresented groups(如非西班牙裔非洲裔美国人、西班牙裔拉丁裔和东亚人群)中尤为突出:尽管这些人群的AD患病率更高(非洲裔18.6%,拉丁裔14%,东亚裔7.4%),但他们在医疗保险数据中的诊断率仅分别比非西班牙裔白人高34%和18%。这种诊断差异源于医疗可及性不足、文化污名化以及系统性偏见等多重因素,凸显了开发既敏感又公平的诊断工具的迫切性。
为应对这一挑战,加州大学洛杉矶分校(UCLA)的研究团队在《npj Digital Medicine》上发表了创新性研究。他们开发了一种结合偏差缓解策略的半监督正例无标签学习(Semi-Supervised Positive Unlabeled Learning, SSPUL)框架,利用UCLA Health系统的多样化电子健康记录(EHR)数据,实现了对未确诊AD的公平预测。该研究的核心创新在于首次将PUL框架与种族特异性偏差缓解技术相结合,既解决了监督学习对昂贵标注数据的依赖问题,又避免了标签偏差对 underrepresented groups 的不利影响。
研究方法上,团队首先从UCLA数据发现库(Data Discovery Repository)中筛选了115,708名符合年龄和记录完整性标准的患者,其中非ATLAS患者(N=97,403)用于模型训练与测试。研究采用四步SSPUL框架:第一步通过概率间隙(probabilistic gap)识别可靠负例(Reliable Negatives, RNs);第二步进行预处理偏差缓解,根据种族特异性概率标准分配附加正/负标签(AP/AN);第三步训练XGBoost分类器;第四步通过优化群体效益均等(Group Benefit Equality, GBE)进行后处理偏差缓解,确保预测阳性率与人群患病率估计值匹配。模型性能通过代理标签(AD相关ICD编码和药物)以及多基因风险评分(Polygenic Risk Scores, PRS)和APOE-ε4等位基因计数进行验证。
SSPUL训练集结构与预测患病率
通过种族特异性伪标签策略,SSPUL训练集中正标签比例(标记阳性+附加阳性)显著提升(非西班牙裔白人12.4%,非洲裔19.6%,拉丁裔14.6%,东亚裔9.8%),而监督基线模型的正标签比例仅与原始诊断率相当(4.3%-5.8%)。这种设计使SSPUL(GBE)预测的AD患病率(非西班牙裔白人18.7%,非洲裔22%,拉丁裔18.5%,东亚裔19.3%)更接近人群患病率估计值,显著改善了 underrepresented groups 的代表性。
SSPUL在准确识别未确诊AD患者方面优于基线监督模型
在歧视性能方面,SSPUL(GBE)在所有种族和民族中均表现最佳:敏感性(0.77-0.81)、平衡准确度(Balanced Accuracy, BA)(0.86-0.88)、受试者工作特征曲线下面积(Area Under the Curve, AUC)(0.91-0.95)和AUCPR(0.81-0.87)显著高于监督基线模型(p<0.001)。监督模型(全特征/MCC)虽然在某些组别中精确度较高,但其敏感性(0.39-0.53)显著较低,平均预测阳性数仅为SSPUL(GBE)的一半。校准分析显示,SSPUL具有最低的期望校准误差和平衡Brier分数(0.17-0.25),表明其预测概率更接近真实患病频率。
SSPUL在不牺牲歧视性能的前提下实现种族公平
公平性评估显示,SSPUL(GBE)的累积均等损失最低(p<0.001),在平衡准确度、均等机会(Equal Opportunity, EO)和GBE等指标上均表现出最优的组间公平性。敏感性分析表明,即使将患者的种族标签重新编码为其他种族,SSPUL的预测敏感性变化最大仅为3%,而监督模型的变化高达10%,证实了SSPUL对种族特征的依赖性更低,预测更稳定。
top预测特征
特征重要性分析识别出前20个关键特征,其中13个与神经/精神障碍相关(如记忆丧失、痴呆),5个与年龄、医疗利用率相关。值得注意的是,恶性肿瘤筛查(1010.2)和褥疮溃疡(707.1)等非神经特征也具有高预测价值。SHAP分析证实,这些特征在不同种族群体中的贡献方向和幅度均无显著差异(p>0.05),体现了模型的公平性。
基因型验证留出集预测
通过UCLA ATLAS社区健康计划基因数据验证,预测阳性组的PRS(3.83)显著高于预测阴性组(0.41)(p<0.001)。APOE-ε4等位基因计数在非西班牙裔白人、非洲裔和东亚裔的预测阳性组中也显著更高(p<0.001),从遗传学角度支持了模型预测的生物学合理性。
研究结论强调,SSPUL框架通过整合半监督学习、数据驱动特征选择和偏差缓解技术,首次实现了在EHR数据中公平、准确地预测未确诊AD。该方法不仅显著提升了 underrepresented groups 的诊断敏感性(较基线模型提高25-38%),还通过GBE优化确保了预测患病率与流行病学估计值一致。此外,特征分析揭示了未确诊AD患者的独特表型特征(如心悸、免疫指标异常),为AD异质性研究提供了新线索。尽管研究存在代理标签非金标准、未涵盖农村地区等限制,但其提出的公平性优化框架为大规模疾病筛查算法提供了重要范式。未来通过多中心验证和纳入更多保护属性(如性别、农村性),这一模型有望成为临床AD风险分层和早期干预的有力工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号