面向临床可靠性:外周血涂片AI分类的可视化与可解释性研究

《Machine Learning with Applications》:Toward Clinical Reliability: Visualizing and Interpreting AI-based Classification in Peripheral Blood Smear Analysis

【字体: 时间:2025年11月02日 来源:Machine Learning with Applications 4.9

编辑推荐:

  本刊推荐:为解决外周血涂片人工形态学分析劳动强度大、存在观察者差异且AI模型预测过程不透明("黑箱"问题)的挑战,研究人员开展了基于VGG16和ResNet50迁移学习模型的血细胞自动分类及Grad-CAM可视化可解释性研究。结果表明模型对11类血细胞分类F1-score达0.9130,并通过热图可视化揭示了模型聚焦于核凹陷、胞质颜色等关键形态特征进行决策,显著提升了AI诊断系统的可靠性和临床可接受度。

  
在临床血液学诊断中,外周血涂片分析犹如一场对细胞形态的“精密侦察”。经验丰富的检验师通过显微镜,仔细观察血细胞的形状、大小和数量变化,从而诊断出贫血、白血病等多种血液疾病。然而,这场“侦察”任务却面临着巨大挑战:传统的人工镜检不仅劳动强度大、耗时费力,而且不同观察者之间的判断可能存在差异,诊断结果难以标准化和规模化。更重要的是,培养一名合格的血液形态学专家需要漫长的训练周期。
随着数字显微镜技术的进步,国际血液学标准化委员会(International Council for Standardization in Haematology)在2019年推荐使用数字成像技术和人工智能(AI)算法来自动分类血细胞,以提高诊断效率和准确性。早期研究已经展示了AI在白细胞分类方面的潜力,例如对中性粒细胞、嗜酸性粒细胞、淋巴细胞等的自动识别达到了较高准确率。但一个关键问题始终困扰着临床医生:AI模型是如何做出判断的?它的预测过程就像一个“黑箱”(black box),我们能看到结果,却不知道它依据了图像的哪些特征。这种不透明性严重阻碍了AI在医疗诊断中的可靠应用,因为医生无法理解和信任一个无法解释其决策基础的“助手”。
为了破解这个“黑箱”难题,让AI的决策过程变得清晰可见,Hiroaki Iwata、Tsukie Shibayama、Miku Watanabe和Hisashi Shimohiro等研究人员在《Machine Learning with Applications》上发表了一项重要研究。他们致力于构建一个高精度的血细胞自动分类模型,并首次系统性地利用可视化技术来解读模型的预测依据,旨在增强AI在血液学分析中的可靠性和可解释性,推动其走向真正的临床应用。
研究人员为开展此项研究,主要应用了几项关键技术方法。首先,他们利用了一个公开的外周血涂片图像数据集,该数据集包含11种类型的正常血细胞图像,采集自巴塞罗那临床医院核心实验室(Core Laboratory of Hospital Clínic de Barcelona)的CellaVision DM96分析仪,样本来源于无感染、血液疾病或肿瘤且未接受药物治疗的个体。其次,研究采用了迁移学习(Transfer Learning)策略,选取了在大型图像数据集ImageNet上预训练的两种经典卷积神经网络(Convolutional Neural Network, CNN)模型——VGG16和ResNet50,对其最终层进行微调以适应血细胞分类任务。第三,为了揭示模型的决策依据,他们应用了梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)技术,生成热力图来直观显示模型在进行分类时所关注的图像区域。模型性能通过准确率、精确率、召回率和F1-score等指标进行评估,并使用混淆矩阵分析分类错误。
4.1. Performance evaluation of the AI models(AI模型性能评估)
研究人员构建的VGG16和ResNet50模型在测试集上均表现出色。VGG16模型的加权平均F1-score为0.9130,略高于ResNet50模型的0.9089。具体到细胞类型,嗜酸性粒细胞、淋巴细胞、血小板等类别的预测准确率超过98%,而早幼粒细胞(promyelocyte)、中幼粒细胞(myelocyte)、晚幼粒细胞(metamyelocyte)以及杆状核中性粒细胞(banded neutrophil)和分叶核中性粒细胞(segmented neutrophil)的分类准确率相对较低,F1-score在0.69至0.85之间。这表明模型能够高精度识别大多数血细胞,但对于形态特征较为接近的细胞亚类(尤其是粒细胞发育过程中的相邻阶段)存在一定的混淆。
4.2. Confusion matrix of the predicted results(预测结果的混淆矩阵)
混淆矩阵的热图进一步证实了上述发现。嗜酸性粒细胞、淋巴细胞、血小板等几乎被完美预测,正确率超过98%。然而,早幼粒细胞、中幼粒细胞和晚幼粒细胞之间的错误分类率较高,例如,13.27%的中幼粒细胞被误判为晚幼粒细胞,22.77%的晚幼粒细胞被误判为中幼粒细胞。杆状核与分叶核中性粒细胞之间也存在显著的相互误判。这些错误分类恰恰反映了血细胞在连续成熟过程中形态特征的渐变性和重叠性,即使是人工镜检有时也难以清晰界定。
4.3. Visualization results of AI model prediction basis(AI模型预测基础的可视化结果)
研究最核心的贡献在于应用Grad-CAM对模型的决策过程进行可视化解读。研究人员重点分析了容易发生误判的细胞组合,通过热力图揭示了模型所关注的图像区域。
4.4. Detection of promyelocytes, myelocytes, and metamyelocytes using the model(使用模型检测早幼粒细胞、中幼粒细胞和晚幼粒细胞)
对于正确分类的早幼粒细胞,模型将其注意力集中在从细胞核到胞质的区域,特别是天青颗粒(azure granules)所在位置,这与血液学家识别早幼粒细胞的关键特征(胞质富含天青颗粒)相符。对于中幼粒细胞,模型同时关注细胞核和胞质的颜色(中幼粒细胞胞质嗜碱性减弱,呈粉红色)。对于晚幼粒细胞,模型则成功识别了细胞核的凹陷(indentation)或肾形特征。在误判案例中,例如将中幼粒细胞误判为晚幼粒细胞时,模型可能过度关注了胞质的粉红色(两者胞质颜色相似);而在一些难以解释的误判中,模型甚至关注了非细胞区域,提示模型可能学习了人类难以理解的某些图像特征。
4.5. Detection of banded neutrophils and segmented neutrophils using the model(使用模型检测杆状核中性粒细胞和分叶核中性粒细胞)
杆状核中性粒细胞的核呈带状弯曲,其最小宽度大于最大宽度的三分之一;而分叶核中性粒细胞的核分叶,最小宽度小于三分之一。可视化结果显示,模型正确分类杆状核细胞时,会关注核的轻微凹陷处;正确分类分叶核细胞时,则关注核的分叶或分离处。在相互误判的案例中,模型对核形态的判断与形态学标准高度相关。例如,当杆状核被误判为分叶核时,其核的凹陷可能已接近分叶标准;当分叶核被误判为杆状核时,可能由于核叶重叠导致模型判断其最小宽度超过三分之一。这些边界情况也正是人工镜检中容易产生分歧之处。
研究的讨论部分对上述结果进行了深入分析。作者指出,Grad-CAM可视化部分揭示了模型的决策逻辑,使其不再是完全不可理解的“黑箱”。模型关注核凹陷、胞质颜色和颗粒等形态特征,这与血液学专家的诊断依据在很大程度上是一致的。对于成熟阶段相邻的细胞(如早幼粒、中幼粒、晚幼粒细胞)以及形态相似的细胞(如杆状核与分叶核中性粒细胞)出现的分类错误,反映了这些细胞类型在形态学上的连续过渡特性,这本身是血细胞形态学分析的难点。
此外,研究人员还进行了简单的定量评估,发现对于误判的早幼粒细胞和杆状核中性粒细胞,Grad-CAM经常未能成功高亮细胞区域,这表明模型在做出错误预测时可能未能聚焦于相关的形态特征。这为进一步改进模型提供了方向。
综上所述,这项研究不仅成功构建了高精度的外周血涂片AI自动分类模型,更重要的是通过Grad-CAM可视化技术,为理解模型的决策过程打开了一扇窗。它初步证明,可解释性方法(Interpretability Methods)有助于应对AI分类中的“黑箱”问题。通过展示AI模型如何像人类专家一样关注关键的形态学特征(如核形态、胞质特性),该研究增强了AI决策的透明度和可信度。虽然Grad-CAM不能完全解释模型决策的因果机制,但它作为一种支持性的可解释性工具,在临床教育、误判原因分析和模型改进方面具有巨大潜力。这项研究为开发更可靠、更值得信赖的AI辅助诊断系统迈出了关键一步,预示着人工智能在血液学乃至更广泛的医学影像分析领域将朝着更加透明和协作的方向发展。未来的研究需要在更大规模、更多样化的数据集上验证该模型,并将其应用于更多细胞类型乃至异常细胞(如白血病细胞)的识别中,以进一步提升其可靠性和实用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号