基于扩散模型的血液细胞形态深度生成分类:突破血细胞形态学分析的临床瓶颈
《Nature Machine Intelligence》:Deep generative classification of blood cell morphology
【字体:
大
中
小
】
时间:2025年11月21日
来源:Nature Machine Intelligence 23.9
编辑推荐:
本刊推荐:研究人员针对血细胞形态学评估中存在的领域偏移、类内变异性和罕见形态变异等挑战,开发了基于扩散模型的生成式分类器CytoDiffusion。该模型在异常检测(AUC 0.990 vs 0.916)、领域偏移鲁棒性(准确率0.854 vs 0.738)和低数据场景性能(平衡准确率0.962 vs 0.924)方面均优于传统判别式模型,生成的合成图像专家无法区分(准确率0.523),为血液学诊断提供了更可靠的人工智能解决方案。
在临床血液学诊断中,血细胞形态学评估一直是一项关键但极具挑战性的任务。传统上,这需要经验丰富的血液学家通过光学显微镜仔细观察血涂片,识别细胞形态的细微变化。然而,这种人工评估存在明显局限性:不同专家之间判断标准不一,罕见细胞类型容易漏诊,且评估结果受到染色质量、显微镜型号等多种技术因素的影响。
更棘手的是,当前基于深度学习的方法主要采用判别式模型,这些模型仅仅学习专家标注的分类边界,而无法真正掌握血细胞形态的完整数据分布。这就导致它们在面对领域偏移(如不同医院的染色差异)、类内变异性(如同类细胞间的形态差异)和罕见形态变异时表现不佳,严重限制了其在临床实践中的应用价值。
为了突破这些瓶颈,来自剑桥大学和伦敦大学学院的研究团队在《Nature Machine Intelligence》上发表了题为"Deep generative classification of blood cell morphology"的研究论文,提出了一种名为CytoDiffusion的创新方法。该方法基于扩散模型,通过生成式学习全面掌握血细胞形态的分布特征,而不仅仅是学习分类边界。
研究团队采用了潜在扩散模型(latent diffusion model)作为基础架构,通过编码器将输入图像编码到潜在空间,添加高斯噪声后,通过扩散过程对每个可能的类别条件进行噪声预测。分类决策基于最小化预测噪声与真实噪声之间的误差。该方法在多个公开数据集(CytoData、Raabin-WBC、PBC、Bodzas)上进行了系统评估,包括真实性测试、不确定性量化、异常检测、领域偏移鲁棒性和低数据性能等多维度的验证。
为了验证模型是否真正掌握了血细胞形态的分布特征,研究团队进行了真实性测试。十位血液学专家对2,880张图像(半数为真实图像,半数为合成图像)进行评估,结果显示专家区分真实与合成图像的总体准确率仅为0.523(95%置信区间:[0.505,0.542]),接近随机猜测水平。这一结果证明CytoDiffusion生成的合成图像在视觉上与真实血细胞图像几乎无法区分。
0首先通过编码器E编码到潜在空间,添加高斯噪声ε~N(0,I)创建噪声潜在表示z,该表示通过每个可能类别条件c的扩散模型,模型预测每个条件的噪声εθ,通过选择最小化预测噪声与真实噪声误差的类别进行分类决策。'>
在四个数据集上的评估表明,CytoDiffusion在CytoData、PBC和Bodzas数据集上达到了最先进的性能水平,证明基于扩散的方法在标准分类任务上能够匹配甚至超越传统判别式模型。
研究团队引入了心理测量学函数来评估模型的不确定性量化能力。结果显示,CytoDiffusion的不确定性度量与理想观察者的心理测量函数高度吻合,表明其不确定性主要来源于数据本身固有的不可约不确定性(aleatoric uncertainty),而非模型能力不足。相比之下,人类专家的不确定性度量反而不如CytoDiffusion准确。
在检测临床重要异常细胞类型方面,CytoDiffusion表现出色。在Bodzas数据集中,以原始细胞(blast)作为异常类时,CytoDiffusion实现了高灵敏度(0.905)和高特异度(0.962),而ViT模型的灵敏度极低(0.281),不适合临床应用。
在模拟真实世界成像条件变化的领域偏移测试中,CytoDiffusion在所有四个数据集上都达到了最先进的准确率,表现出优秀的泛化能力,能够适应不同显微镜、相机和染色技术带来的变化。
在有限数据条件下(每类10、20、50张图像),CytoDiffusion在所有四个数据集上 consistently 优于判别式模型EfficientNetV2-M和ViT-B/16。在数据最稀缺的条件下,传统判别式方法难以有效泛化,而CytoDiffusion仍能保持良好性能。
CytoDiffusion能够生成反事实热图,突出显示图像中需要改变才能被分类为不同细胞类型的区域。这些热图直接来自模型的生成过程,无需额外的解释层,为理解模型的决策过程提供了直观工具。
neutrophil,突出显示需要改变以便将图像分类为中性粒细胞的区域;最右侧为阈值化热图与原始图像的叠加。b,各种细胞类型转换的反事实热图矩阵。'>
这项研究不仅提出了CytoDiffusion这一创新的血细胞图像分类方法,还建立了一个系统的评估框架,从多个维度全面评估医学影像模型的性能。研究表明,生成式方法通过掌握完整的数据分布,能够有效解决判别式模型在临床部署中面临的关键挑战。
CytoDiffusion的核心优势在于其生成式特性,使其能够学习血细胞形态的全面表示,而不仅仅是分类边界。这种深度的表示学习是模型在异常检测和领域偏移鲁棒性方面表现出色的可能机制。模型生成的反事实热图提供了直观的解释工具,增强了临床实践中的可信度。
尽管CytoDiffusion的计算成本相对较高(平均每张图像1.8秒),但研究团队指出,在医学领域类别数通常远少于一般图像分类任务的情况下,这一问题并不突出。未来通过代码优化、模型蒸馏和硬件进步,可以进一步改善计算效率。
该研究的局限性包括尚未充分利用生成模型的表示学习潜力,以及未在研究中实现医疗诊断公平性的检测和保障。未来工作可以探索在潜在空间中使用更紧凑的生成建模架构,以及通过条件生成来理解和缓解不同人口群体间的潜在偏见。
总之,CytoDiffusion与综合评估框架相结合,为医疗保健领域更强大、可解释和可信赖的人工智能系统迈出了重要一步。未来工作不仅应完善这些方法并评估其在其他医学影像领域的适用性,还应明确测试其促进公平和减轻偏见的能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号