种族与族裔对晚期乳腺癌风险预测模型性能的影响:一项关于算法公平性的重要评估

《npj Digital Medicine》:Effect of race and ethnicity on advanced breast cancer risk prediction model performance

【字体: 时间:2025年12月15日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对临床风险预测模型中存在的算法偏见问题,探讨了从BCSC晚期乳腺癌风险模型中移除种族和族裔变量的影响。研究发现,移除这些变量会导致模型校准性能变差:高估亚洲女性风险(E/O=1.28),低估黑人女性风险(E/O=0.61),影响筛查策略的精准推荐。研究强调保留种族和族裔变量有助于识别更多可能受益于年度筛查和补充成像的高风险人群,为实现医疗公平提供了重要证据。

  
在精准医疗时代,临床风险预测模型已成为医疗决策的重要工具,然而这些模型可能无意中加剧现有的健康 disparities(差异)或引入新的偏见。特别是在乳腺癌筛查领域,如何平衡模型准确性与算法公平性成为亟待解决的问题。2024年美国预防服务工作组(USPSTF)推荐40-74岁女性每两年进行一次乳腺X线筛查,同时联邦乳腺密度法要求对47%的致密乳腺女性推荐补充成像,这使得BCSC(Breast Cancer Surveillance Consortium)开发的晚期乳腺癌风险预测模型在指导筛查间隔和补充成像决策方面变得尤为重要。
该模型是首个可用于临床决策的晚期乳腺癌风险预测工具,但其中包含的种族和族裔变量引发了关于算法公平性的担忧。种族天真(race-naive)预测建模被提议作为解决算法偏见的一种方法,但这种方法在不同人群中的实际效果如何尚不明确。晚期乳腺癌是乳腺癌死亡率的替代指标,因此准确评估晚期乳腺癌风险对于制定个性化筛查策略至关重要。
为了评估在BCSC晚期乳腺癌风险模型中包含种族和族裔对算法偏见和模型公平性的影响,Karla Kerlikowske博士团队开展了一项大规模研究,比较了包含与不包含种族和族裔变量的模型性能差异。这项研究发表在《npj Digital Medicine》期刊上,为我们理解风险预测模型中的公平性问题提供了重要见解。
研究人员主要利用了BCSC乳腺摄影登记处的数据,这是一个与美国人口 demographics(人口统计学特征)相当的大型数据库。研究纳入了2005年1月至2017年12月期间接受筛查的931,186名40-74岁女性,共涉及2,542,382次年度筛查和752,049次双年度筛查。研究采用逻辑回归模型估计绝对晚期乳腺癌风险,使用MICE(Multiple Imputation Chained Equations,多重插补链式方程)处理缺失数据,并通过5折交叉验证评估模型判别准确性(AUC,Area Under the Curve,曲线下面积)。6年累积风险估计采用考虑竞争风险的离散时间生存模型。
Calibration(校准)
研究发现,在包含种族和族裔的原始模型中,所有种族和族裔群体的校准性能均最优,预期与观察到的风险比(E/O)接近1.00。然而,当从模型中排除种族和族裔后,校准性能出现显著变化:亚洲女性的风险被高估(E/O=1.28, 95%CI=1.05-1.66),而黑人女性(E/O=0.61, 95%CI=0.53-0.70)和其他/多种族女性(E/O=0.82, 95%CI=0.70-0.99)的风险被低估。双年度筛查者也观察到类似模式,其中西班牙裔女性的风险被高估(E/O=1.14, 95%CI=0.92-1.52)。
Discrimination(判别)
整体判别准确性在包含种族和族裔的模型中略高(AUC=0.682 vs 0.677)。在不同种族和族裔群体中,两个模型的判别准确性相似,排除种族和族裔的模型在亚洲、黑人和其他/多种族女性中略高,在西班牙裔和白人女性中略低。
Absolute risk(绝对风险)
基于年度筛查的预测风险,排除种族和族裔后,被归类为 intermediate/high risk(中/高风险)的亚洲女性比例从3.4%增加到10.2%,而黑人女性则从58.5%下降到24.1%。在确诊晚期乳腺癌的女性中,包含种族和族裔的模型将更高比例的黑人(75.3% vs 47.5%)、西班牙裔和其他/多种族女性识别为中/高风险,而排除种族和族裔的模型则识别出更多亚洲(6.1% vs 16.7%)和白人晚期乳腺癌患者为中/高风险。
研究结论强调,从晚期乳腺癌风险模型中移除种族和族裔会恶化黑人、亚洲女性的校准性能,并对判别准确性产生小幅影响。这种校准性能的下降可能导致更少可能受益于年度筛查和/或补充成像的黑人、西班牙裔和其他/多种族女性被识别为高风险个体。
讨论部分指出,黑人女性是受模型修改影响最大的群体。包含种族和族裔的模型能识别出最多可能受益于强化筛查的黑人晚期乳腺癌患者,但同时也可能将更多不会发展为晚期乳腺癌的黑人女性归类为高风险。相比之下,亚洲女性的晚期乳腺癌发生率最低,包含种族和族裔的模型只会遗漏少量晚期乳腺癌患者。
这种权衡关系凸显了个性化医疗中的核心挑战:如何在正确识别高风险女性和避免对低风险女性造成不必要的筛查危害之间取得平衡。包含种族和族裔的模型能使更多可能发展为晚期乳腺癌的黑人、西班牙裔和其他/多种族女性受益于强化筛查,而以遗漏少量亚洲患者为代价。
该研究的重要意义在于为当前关于临床算法中是否应该使用种族和族裔变量的辩论提供了实证证据。研究表明,在某些情况下,包含种族和族裔变量可能有助于解决健康差异,而不是加剧不平等。对于校准性能良好但判别准确性适中(AUC 0.6-0.7)的风险模型,如BCSC晚期乳腺癌风险模型,它们仍然为个体化咨询和权衡预防性临床干预的利弊提供了有用视角。
未来研究需要探索将新的风险因素,如 mammographic calcifications(乳腺X线钙化)、social vulnerability index(社会脆弱性指数)和人工智能衍生指标纳入模型,以进一步提高判别准确性,同时确保所有女性群体的校准性能得到保持。此外,需要将太平洋岛民女性从其他种族群体中分离出来进行单独分析,因为该群体具有更高的晚期乳腺癌风险。
这项研究为开发更加公平、有效的癌症风险预测模型提供了重要指导,强调了在追求算法公平性的过程中需要仔细评估不同人群的具体影响,而不是简单地移除所有人口统计学变量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号