电子健康记录中的固有偏见:对偏见来源的系统性回顾
《ACM Transactions on Intelligent Systems and Technology》:Inherent Bias in Electronic Health Records: A Scoping Review of Sources of Bias
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Intelligent Systems and Technology
编辑推荐:
电子健康记录(EHR)中存在的偏见可能加剧医疗不平等并影响AI医疗系统的可靠性。本文通过系统文献回顾,提出EHR偏见六大来源:临床试验历史遗留偏差、数据缺失/不完整、临床医师无意识偏见、转诊与入院偏差、诊断风险差异偏差及设备与算法偏差。现有研究多聚焦数据偏见,对其他类型偏见分析不足,且缺乏对偏见复合效应及具体医疗后果的实证研究。建议采取"偏见优先"的系统化数据治理方案,加强跨学科研究合作。
摘要
1. 摘要
1.1 目标
电子健康记录(EHR)中存在的偏见常常被用作训练医疗人工智能模型的数据来源,这些偏见可能会显著加剧健康不平等,并对医疗领域中伦理和负责任的人工智能的采用构成挑战。这些偏见来源于多种途径,其中一些在文献中并未得到充分记录(例如,医疗设备测量中的偏见)。偏见体现在数据收集和标注的方式上,也可能源于临床医生的隐性或无意识偏见,或是数据处理工具本身的问题。这些偏见及其在医疗记录中的体现可能会削弱数据的可靠性,进而影响临床判断和医疗结果。此外,当使用医疗记录来构建数据驱动的解决方案时,偏见可能会进一步加剧,导致系统本身延续并加剧健康差异。本文献综述旨在对EHR中存在的偏见主要来源进行分类。
1.2 方法
我们于2023年1月19日在PubMed和Web of Science上检索了2016年至2023年间发表的英文同行评审文献,采用PRISMA方法逐步筛选文献。从最初获得的430篇论文中,去除了27篇重复论文,并对403篇论文进行了资格筛选。在标题和摘要筛选后,又排除了196篇论文;经过全文审查后,最终确定了116篇论文作为研究对象。
1.3 结果
现有研究大多关注EHR数据中的个别偏见,但缺乏对这些偏见进行全面分类的综述。为填补这一空白,我们提出了一种系统性的分类框架,以更好地理解和处理EHR数据中的多种偏见。该框架确定了六个主要偏见来源:a) 来自过去临床试验的偏见;b> 数据相关偏见(如信息缺失或不完整);c) 人为相关偏见(包括临床医生的隐性偏见);d) 转诊和入院偏见;e> 诊断或风险差异偏见;f> 设备和算法中的偏见。如表1所示,这一分类框架为系统地评估和解决这些问题提供了有价值的工具。
1.4 结论
机器学习和数据驱动的解决方案有潜力改变医疗服务的提供方式,但并非没有局限性。当前系统中的核心输入(数据和人为因素)包含多种偏见来源,而这些偏见来源的记录和分析都较为不足。现有证据主要集中在数据相关偏见上,而对其他来源的关注较少或仅基于轶事。然而,这些不同的偏见来源可能会相互叠加,产生累积效应。因此,要全面理解这些问题,我们需要探索这些多样化的偏见来源。虽然EHR中的种族偏见已得到较多记录,但其他偏见来源的研究和记录较少(例如性别相关偏见、性取向歧视、社会引发的偏见以及隐性的人为认知偏见)。此外,一些现有研究缺乏关于偏见影响的实质性证据,仅展示了不同群体间疾病发病率的差异,而这本身并不能证明偏见的存在。我们的研究表明,数据偏见、人为偏见和机器偏见在医疗领域普遍存在,会显著影响治疗决策和结果,并加剧健康差异。了解各种偏见如何影响人工智能系统和推荐结果至关重要。我们建议研究人员和医疗人员制定防护措施,并采取“以偏见为导向”的方法来开发数据驱动的解决方案。需要更多实证证据来揭示不同偏见来源对健康结果的具体影响。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号