基于图像的可解释人工智能突破传统 dysplasia 识别局限,精准诊断骨髓增生异常肿瘤

《npj Precision Oncology》:Image-based explainable artificial intelligence accurately identifies myelodysplastic neoplasms beyond conventional signs of dysplasia

【字体: 时间:2025年12月12日 来源:npj Precision Oncology 8

编辑推荐:

  本研究针对骨髓增生异常肿瘤(MDS)传统细胞形态学评估存在观察者间差异大、耗时长的临床痛点,开发了一种基于骨髓涂片(BMS)的端到端深度学习(DL)模型。该研究成功实现了MDS、急性髓系白血病(AML)及健康供者样本的高精度区分(内部测试及外部验证ROC AUC均>0.97),并通过遮挡敏感度映射(OSM)揭示了模型关注核结构等超越经典 dysplasia 的形态学特征,为MDS的准确、可解释自动化诊断提供了新工具。

  
在血液肿瘤的诊断领域,骨髓增生异常肿瘤(MDS)一直是一个挑战。这种克隆性髓系恶性肿瘤以无效造血、血细胞减少、骨髓增生异常(dysplasia)和 recurrent 遗传事件为特征。准确评估骨髓细胞形态对于MDS的初始诊断、疗效评估以及向急性髓系白血病(AML)转化的监测至关重要。然而,与相对容易计数的原始细胞不同,dysplasia 的迹象更为细微,其准确识别高度依赖于经验丰富的血液学专家。即便如此,这种识别过程也常常充满挑战:它既费时费力,又容易受到观察者间变异的影响——即使是资深形态学家之间也可能得出不同结论。此外,本地诊断与中心实验室复核结果之间也常存在差异。这种诊断上的不确定性,直接影响了患者的精准分型和治疗决策。
就在传统方法面临瓶颈之时,人工智能技术,特别是深度学习(DL),在图像分类领域展现出巨大潜力。近年来,已有研究尝试将卷积神经网络(CNN)应用于骨髓形态学评估,但多数方法依赖于对涂片中单个细胞进行繁琐的人工标注,即所谓的“细胞级标签”。这种“自下而上”的策略不仅耗时耗力,其本身也因标注者主观性而存在固有偏差。能否绕过这一瓶颈,直接让AI从骨髓涂片的区域图像中学习并做出诊断级别的判断,成为了一个亟待探索的方向。
发表在《npj Precision Oncology》上的一项最新研究,给出了令人振奋的答案。由德累斯顿大学医院Jan-Niklas Eckardt博士领衔的研究团队,成功开发了一套基于图像的可解释人工智能框架,能够仅凭骨髓涂片(BMS)的区域兴趣点(ROI)图像,以极高的准确度区分MDS、AML和健康供者样本,而无需任何细胞级别的人工标注。更重要的是,通过可解释性技术,研究揭示了AI所关注的形态学特征不仅包括了经典的 dysplasia 迹象,更指向了一些人眼难以察觉的、可能与疾病相关的“数字生物标志物”。
为了开展这项研究,研究人员汇集了来自德累斯顿大学医院的463例MDS患者、1301例AML患者(来自德国白血病研究联盟SAL的多中心临床试验)以及236例健康骨髓供者的预处理骨髓涂片。所有样本均经过标准May-Gruenwald-Giemsa染色,并通过数字扫描仪获取高分辨率全切片图像。研究人员从每张涂片中选取一个或多个代表性子区域(对于MDS患者选取4个区域以捕捉更细微的病变)导出图像,并基于病例级别的金标准诊断(整合了细胞形态学、组织学、细胞遗传学和分子遗传学结果)为每个图像区域打上“MDS”、“AML”或“供者”的标签。研究采用端到端的深度学习策略,构建了多个二元分类模型(如MDS vs. AML, MDS vs. 供者)。他们系统评估了六种主流CNN架构(包括ResNet, DenseNet, SqueezeNet等),并采用5折交叉验证进行模型训练和内部测试。模型的泛化能力在来自慕尼黑白血病实验室(MLL)的外部验证队列中得到了进一步验证。为了理解模型的决策依据,研究采用了遮挡敏感度映射(OSM)技术,通过系统地遮挡图像部分区域并观察模型分类性能的变化,来可视化对分类至关重要的图像区域。
研究结果
深度学习模型在内部和外部验证中均表现出卓越的分类性能
在区分MDS与健康供者的任务中,DenseNet-201架构表现最佳,准确度达到0.98,受试者工作特征曲线下面积(ROC AUC)为0.97。在区分MDS与AML的任务中,SqueezeNet架构表现最优,准确度为0.98,ROC AUC高达0.99。即使在对AML进行亚组分析时,例如区分MDS与伴有骨髓增生异常相关改变(AML-MRC)的AML,或与伴有NPM1突变的AML,模型依然保持了很高的准确度(0.95-0.99)。在外部验证中,模型同样表现出色,区分MDS与供者的ROC AUC为0.98(准确度0.99),区分MDS与AML的ROC AUC为0.98(准确度0.92)。此外,模型在区分伴有原始细胞增多(MDS-IB1/2)与不伴原始细胞增多的MDS、以及区分MDS-IB1与MDS-IB2等更具挑战性的任务上也显示出一定的潜力(ROC AUC 分别为 0.87, 0.85, 0.80)。
可解释性分析揭示模型关注核形态特征,可能超越经典 dysplasia 定义
通过OSM分析,研究人员发现模型的注意力集中在细胞上,特别是粒细胞系、红细胞系和巨核细胞,而非背景或涂片污迹。高重要性区域确实涵盖了一些明确的 dysplasia 迹象,如染色质凝块、核分叶异常、双核等核形态改变。但有趣的是,在一些被人眼判定为“无明显异常”的细胞上,模型也赋予了高重要性,并且其关注点同样集中在细胞核,有时包括核周区域。这表明深度学习模型可能捕捉到了更多人眼无法量化、更为精细和微妙的形态学改变。相反,一些经典的 dysplasia 特征,如粒细胞质中颗粒减少(hypogranulation),反而未被模型重视。研究人员推测,这可能是因为模型对其决策已有足够信心(置信度接近1.0),无需评估所有 dysplasia 迹象,或者某些迹象在训练集中出现频率过低,模型未能充分学习。
研究结论与意义
本研究成功开发了一个基于端到端深度学习的软件框架,能够利用来自2000名个体患者的骨髓涂片,以极高准确度区分MDS、AML和健康供者。其核心创新在于摒弃了费时费力且易产生偏倚的细胞级标注,直接利用区域级标签进行诊断级预测,为血液病理学的AI应用提供了一条更高效、更可靠的路径。
研究的另一大亮点在于其对模型可解释性的深入探索。通过OSM技术,研究不仅验证了模型确实学习了与疾病相关的形态学特征(证明其非“黑箱”),更重要的是,它可能揭示了超越传统认知的“数字生物标志物”。模型对“正常”细胞核形态的高度关注提示,在MDS中可能存在一些独立于经典 dysplasia 的、人眼难以识别的细微核结构改变。这为未来探索这些AI识别的形态学特征与特定遗传改变或基因表达谱之间的关联开辟了新方向。例如,CNN或许能帮助发现新的基因-形态学联系。
当然,该研究也存在一些局限性,如基于回顾性数据、需要人工选择感兴趣区域可能引入偏差、目前仅能进行二元分类且未包含非恶性疾病(如营养缺乏、感染等引起的继发性 dysplasia)的对照样本。未来的工作将聚焦于前瞻性验证、纳入更广泛的鉴别诊断样本以提升临床适用性、开发多分类器,并在更大样本量的多中心研究中探索对最新WHO和ICC分类中定义的各类MDS/AML遗传亚型的区分能力。同时,尽管近期出现了一些病理学基础模型,但它们尚未在骨髓涂片图像上得到充分训练和评估,这亦是未来的研究方向。
总而言之,这项研究标志着向自动化、客观化、可解释的骨髓形态学评估迈出了重要一步。它不仅提供了一个强大的诊断工具,更通过可解释的AI,为我们理解MDS的形态学本质提供了新的视角,有望最终推动MDS的精准诊断和管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号