安全网医疗系统中算法偏见的识别与缓解:基于阈值调整的公平性优化实践

【字体: 时间:2025年06月06日 来源:npj Digital Medicine 12.4

编辑推荐:

  为解决医疗AI算法在种族/保险等社会人口学分组中的性能差异问题,纽约市健康+医院团队开展了针对哮喘急诊预测和再入院模型的偏见缓解研究。通过阈值调整(threshold adjustment)和拒绝选项分类(reject option classification)两种后处理方法,成功将目标组别的平等机会差异(EOD)控制在5个百分点内,同时保持模型准确率下降<10%。该研究为资源有限的安全网医疗系统提供了可操作的偏见缓解方案,相关代码已开源。

  

随着人工智能在医疗领域的快速渗透,算法偏见正成为加剧医疗资源分配不平等的隐形推手。纽约市健康+医院(NYC Health+Hospitals)作为美国最大的公立安全网医疗系统,90%服务对象为有色人种患者,70%依赖医疗补助或无保险。这类系统往往最先遭遇算法偏见带来的负面影响——当预测模型在不同种族、保险状态的群体中表现差异显著时,有限的医疗资源可能被错误导向,进一步恶化历史性医疗服务不足群体的健康结局。

研究团队聚焦电子病历中两个临床预测模型:哮喘急性发作风险模型(AUROC 0.756)和30天非计划再入院模型(AUROC 0.719)。基线分析揭示了令人担忧的差异:哮喘模型中白人患者的假阴性率(FNR)比非洲裔患者高31.8个百分点(0.828 vs 0.51);再入院模型中自费患者的FNR比医保患者高41.5个百分点(0.797 vs 0.382)。这种性能差异意味着高风险患者可能因人口统计学特征而被系统性地忽视。

为验证可扩展的解决方案,研究人员测试了三种后处理方法:自定义阈值调整、基于Aequitas工具包的阈值调整以及拒绝选项分类(ROC)。关键技术包括:1)使用SQL和R/Python分析53,099例哮喘患者和139,132例再入院患者的EMR数据;2)以平等机会差异(EOD)为核心指标,比较种族/民族、性别、语言和保险分组的假阴性率差异;3)通过调整不同人口亚组的风险阈值(如将哮喘模型中白人患者的阈值从0.15降至0.07)优化公平性。

研究结果显示,自定义阈值调整在哮喘模型中将种族亚组的最大绝对EOD从25.8个百分点降至4.0个百分点,同时仅使准确率从86.7%降至86.1%。对于再入院模型,该方法将保险亚组的最大EOD从30.3个百分点降至3.2个百分点,准确率反而从75.0%提升至75.4%。相比之下,ROC方法虽然降低了某些偏见指标,却导致警报率骤降31.8%(哮喘模型)和31.7%(再入院模型),超出临床可接受范围。

值得注意的是,阈值调整展现出独特的实用优势:不需要重新训练模型,仅通过调整决策阈值即可实现公平性改进;计算资源需求低,适合安全网医院的技术环境;实施过程透明,各亚组的调整阈值可明确追溯(如西班牙语患者阈值调整为0.06)。这些特性使其成为资源有限系统的理想选择。

该研究创新性地开发了《补充实践手册》,为低资源环境提供分步指导:从识别偏见到选择敏感属性(如优先处理EOD>5个百分点的种族/保险分组),再到阈值优化与临床验证。这种标准化流程填补了医疗AI公平性实践指南的空白,特别是针对服务弱势群体的公立医院系统。

讨论部分强调,虽然阈值调整不能解决数据缺失或特征选择等根源性偏见,但作为部署后的"快速修复"方案,能有效阻断算法偏见对临床决策的直接影响。研究者建议将此类评估纳入医疗AI的常规监管流程,并开发能同时处理交叉性偏见(如种族+保险的交互影响)的高级方法。这项发表在《npj Digital Medicine》的工作证明,通过务实的技术选择,即使资源受限的医疗机构也能在数字医疗时代推动更公平的健康结局。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号