医学影像诊断中的人工智能与人类视觉偏差:互补优势与潜在风险
《npj Digital Medicine》:Distinct visual biases affect humans and artificial intelligence in medical imaging diagnoses
【字体:
大
中
小
】
时间:2025年12月23日
来源:npj Digital Medicine 15.1
编辑推荐:
为解决AI与放射科医生在医学影像诊断中因视觉感知差异导致的决策分歧问题,研究人员开展了一项关于AI与人类视觉偏差的综述研究。研究指出,AI能够识别人类难以察觉的亚视觉(subvisual)和非视觉(nonvisual)特征,实现“虚拟组织病理学”和早期疾病检测,但也存在依赖伪相关、缺乏因果推理及潜在偏见等风险。该研究为构建人机协同的精准诊断新范式提供了关键理论依据。
在医学影像诊断领域,人工智能(AI)正展现出超越人类视觉极限的潜力。它能够从一张看似正常的CT或MRI图像中,捕捉到连经验丰富的放射科医生都难以察觉的细微纹理和统计模式,从而预测疾病风险、判断基因突变状态,甚至评估治疗反应。然而,这种“火眼金睛”也带来了一个核心矛盾:当AI的诊断依据是医生肉眼无法验证的“亚视觉”或“非视觉”特征时,医生该如何信任并采纳AI的建议?这种“黑箱”决策不仅挑战了传统的医学伦理,也引发了关于诊断责任归属的深刻思考。
为了系统阐述这一前沿议题,来自斯坦福大学和卡尔加里大学的研究团队在《npj Digital Medicine》上发表了题为《Distinct visual biases affect humans and artificial intelligence in medical imaging diagnoses》的综述文章。该研究深入剖析了放射科医生与AI在视觉感知上的根本差异,揭示了AI在识别“看不见”的疾病信号方面的巨大潜力,同时也警示了其依赖伪相关、缺乏因果推理能力以及存在潜在偏见的风险。文章为构建一个安全、可信且高效的人机协同诊断新范式提供了关键的理论框架。
本研究为一项综述性研究,主要基于对现有文献的系统性梳理与分析,并未涉及具体的实验操作。其核心方法在于整合了多个关键领域的研究成果,包括:
- 1.深度学习(Deep Learning)与卷积神经网络(Convolutional Neural Networks, CNNs):作为现代AI影像分析的核心技术,该方法通过端到端(end-to-end)的训练方式,直接从海量标注数据中学习复杂的特征表示,无需依赖人工设计的特征。
- 2.放射组学(Radiomics):通过高通量提取医学图像中的定量特征(如纹理、形状、强度等),将图像转化为可挖掘的数据,并结合机器学习分类器(如逻辑回归、支持向量机等)进行疾病预测。
- 3.多中心队列验证:研究引用了多个大型、多中心、去标识化的医学影像数据库作为证据,如医学影像与数据资源中心(MIDRC)、癌症影像档案(TCIA)等,以证明AI模型在不同人群和扫描设备间的泛化能力。
- 4.可解释性技术:利用梯度加权类激活映射(Grad-CAM)和SmoothGrad等工具生成显著图(saliency maps),以可视化AI模型在图像中的关注区域,提供部分决策透明度。
- •放射科医生:其诊断能力建立在长期的医学教育和临床实践之上。他们不仅依赖模式识别,更具备基于生物学原理的因果推理能力。当面对罕见病、解剖变异或图像伪影时,他们能够运用基础医学知识进行逻辑推断,而非单纯依赖数据模式。
- •AI:AI通过监督学习进行训练,其目标是优化模型参数以最小化预测结果与“金标准”(ground truth)之间的误差。这种数据驱动的方式赋予了AI极大的灵活性,使其能够学习到与人类视觉系统完全不同的特征组合,甚至包括那些缺乏明显视觉对应物的高阶统计模式。
- •人类视觉的进化偏好:人类视觉系统在进化过程中被塑造成优先识别具有生态学意义的物体(如人脸、动物、工具等)。这种倾向在放射学中表现为大量以自然物体命名的影像学征象(如“蜂鸟征”、“熊猫脸征”),这反映了人类大脑对特定形状的固有偏好。
- •AI的感知优势:AI不受生物视觉系统的物理限制。卷积神经网络能够并行处理从单个体素统计到全器官几何形态的多尺度信息,整合局部细节和空间背景。这使得AI能够检测到低于人类显著性阈值的微弱、空间分散的线索,并对灰度或颜色的细微纹理变化进行量化分析。
- •视觉认知偏差:放射科医生在阅片过程中会受到“无意视盲”(inattentional blindness)和“搜索满足”(satisfaction of search)等认知偏差的影响。研究表明,放射科医生有时会直接注视病变区域却未能发现病灶,例如在寻找肺结节时可能忽略乳腺癌病灶。
- •边缘偏好:人类视觉系统倾向于识别边界清晰、对比度高的病变。然而,在临床实践中,边界模糊、不规则的病灶往往更具恶性风险。AI模型可以通过专门训练来克服这种偏好,从而更准确地检测低对比度、部分实性的结节。
- •亚视觉与非视觉特征的临床价值:研究列举了多个案例,证明AI能够从影像中提取具有临床意义的“不可见”特征。例如,从眼底照片预测心血管风险因素、从平扫CT中检测急性缺血性脑卒中、从常规MRI中预测脑肿瘤的基因突变状态等,这些能力超越了传统视觉诊断的边界。
- •伪相关与捷径学习:AI模型可能学习到与疾病无关但高度相关的“捷径”特征。例如,一个用于诊断气胸的模型可能学会了识别图像中的胸腔引流管,而非气胸本身,导致其在没有引流管的病例中表现不佳。
- •数据分布偏移:AI模型在训练数据之外的环境(如不同医院、不同扫描设备或协议)中性能可能显著下降,缺乏人类医生的适应性和常识推理能力。
- •人口统计学偏见:AI模型已被证明能够从医学图像中准确识别患者的种族等人口统计学特征,并可能将这些特征用于决策,导致在不同人群间产生系统性性能差异,引发公平性问题。
本研究系统性地阐述了放射科医生与AI在医学影像诊断中视觉感知的根本差异。AI凭借其强大的数据挖掘能力,能够识别人类难以察觉的亚视觉(subvisual)和非视觉(nonvisual)特征,这为医学诊断带来了三大核心价值:在看似正常的影像中发现早期疾病、实现“虚拟组织病理学”以无创方式获取分子和基因信息、以及从常规检查中挖掘偶发异常。
然而,AI的“黑箱”特性也带来了显著风险。其决策可能基于伪相关(spurious correlations)而非真实的病理生理信号,且缺乏因果推理能力和对数据分布变化的适应性。此外,AI模型可能编码并利用敏感的人口统计学特征,导致在不同人群间产生性能差异和偏见。
为了在临床实践中安全、有效地整合AI,未来的发展方向应聚焦于构建一个基于置信度的分诊框架。该框架应根据AI的内部置信度来决定其输出对放射科医生的影响程度。同时,必须通过持续的后市场监测和再校准来确保AI模型的稳健性。最终,通过多学科合作,将算法衍生的影像特征与经过验证的生物标志物(如组织病理学、分子检测)联系起来,建立“生物识读”的AI系统,将是赢得临床信任、实现人机协同精准诊断的关键。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号