综述:精准健康领域中临床风险预测模型的公平性指标报告:范围综述

【字体: 时间:2025年06月16日 来源:Online Journal of Public Health Informatics

编辑推荐:

  这篇综述系统评估了临床风险预测模型(如心血管疾病CVD和COVID-19)中公平性指标的应用现状,揭示了当前研究在敏感特征(如种族、性别)评估上的缺失,并提出了"解释-实施-连接-收集"(I2C2)框架以推动算法公平性在精准健康(Precision Health)领域的实践。

  

背景
临床风险预测模型作为精准健康的核心工具,正逐步整合到数字化医疗系统中。然而,这些模型在敏感特征(如性别、种族)上的公平性评估却鲜少被关注。公平性指标能有效识别模型潜在的差异性,但实际应用中仍存在数据同质化、指标定义模糊等挑战。

目标
通过实证分析CVD和COVID-19两类疾病的高影响力预测模型,评估公平性指标的应用现状,并提出改进策略。

方法
采用范围综述方法,筛选2013-2023年高引用文献(CVD模型需>100次引用,COVID-19模型需>10-50次引用),最终纳入23篇CVD研究和22篇COVID-19研究。

结果
研究发现:

  • CVD模型:26%采用性别分层模型,但92%的种族数据集中于单一群体,且无种族分层研究。
  • COVID-19模型:仅9%使用性别分层,50%的种族数据存在主导群体。
  • 共同缺陷:无一研究使用公平性指标(如均等化机会Equalized Odds或人口统计平等Demographic Parity),且种族数据多未明确区分社会属性与生物学特征。

讨论
两大瓶颈制约公平性实践:

  1. 数据多样性不足:多数研究依赖欧美人群(Global North),种族数据中85%以上为白人群体,且地理分布失衡。
  2. 方法论模糊性:敏感特征定义不清(如混淆种族Race与遗传祖先Genetic Ancestry),且公平性指标选择缺乏临床场景适配性。

解决方案:I2C2框架

  • Interpret(解释):明确敏感变量的社会或生物学属性,如区分性别(Sex)与性别认同(Gender)。
  • Implement(实施):将公平性纳入TRIPOD等临床报告指南。
  • Connect(连接):搭建方法学研究者与临床实践者的桥梁,推广工具包(如AI Fairness 360)。
  • Collect(收集):优先纳入多民族、跨区域数据,例如通过电子健康记录(EHR)扩大样本多样性。

未来展望
近期少数研究(如产后抑郁预测模型)已尝试将公平性作为核心评估指标,通过重加权(Reweighing)等技术减少群体间差异。这一趋势提示,结合临床需求选择特定公平性指标(如对稀缺医疗资源采用均等化机会),或能实现精准与公平的双赢。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号