基于混合逆卷积与卷积神经网络的动态核生成模型在白血病及白细胞分类中的突破性应用

《Scientific Reports》:Dynamic kernel generation through hybrid involution and convolution neural networks for leukemia and white blood cell classification

【字体: 时间:2025年12月16日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对白血病诊断中细胞形态学差异细微的挑战,开发了一种混合逆卷积-卷积神经网络(HICNN)。该模型通过融合逆卷积层的空间自适应特征提取能力与卷积层的平移不变性学习,实现了白血病分期和白细胞亚型分类的精准识别。在Hema-DA(白血病分期)和Hema-DB(白细胞亚型)数据集上分别达到99.5%和98.00%的分类准确率,Brier评分低至0.0019-0.0069,显著优于现有主流模型。该研究为血液学诊断提供了可靠的自动化解决方案,对早期白血病筛查和精准医疗具有重要意义。

  
在血液癌症诊断领域,白血病作为一种高度恶性的造血系统肿瘤,其早期诊断一直面临重大挑战。由于不同阶段和亚型的白血病细胞在显微镜下仅呈现细微的形态学差异,即使是经验丰富的血液学专家也难免出现误判。传统的诊断方法如血涂片显微镜检查和骨髓活检虽然有效,但存在劳动强度大、成本高且依赖专业人员等局限性。
近年来,虽然机器学习和深度学习技术为白血病诊断带来了自动化解决方案,但传统的卷积神经网络(CNN)因其固定的滤波器设计,在捕捉细胞局部细微变化方面存在明显不足。这种局限性导致模型在区分形态相似的白血病亚型时表现不佳,特别是对于急性淋巴细胞白血病(ALL)、急性髓系白血病(AML)、慢性淋巴细胞白血病(CLL)和慢性髓系白血病(CML)等主要亚型的精确鉴别。
为了解决这一难题,来自纳吉兰大学和COMSATS大学伊斯兰堡校区的研究团队开发了一种创新的混合逆卷积-卷积神经网络(HICNN)。该模型巧妙地将逆卷积层的空间自适应特性与卷积层的层次特征学习能力相结合,通过并行处理机制实现了对细胞形态细微差异的精准识别。
研究方法上,团队采用了两个公开可用的血液学图像数据集:Hema-DA(包含3,256张高分辨率显微镜血液细胞图像,涵盖良性、早期、前期和进展期四个白血病阶段)和Hema-DB(包含9,957张外周血涂片图像,涵盖嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞四种白细胞亚型)。所有图像统一预处理为224×224分辨率,并应用了强度标准化和数据增强技术以缓解类别不平衡问题。
核心技术方法包括三个关键组成部分:逆卷积神经网络通过动态生成空间自适应核实现上下文特异性特征提取;卷积神经网络捕获平移不变层次模式;混合模型配置通过并行混合块实现协同特征提取。模型采用Adam优化器(学习率0.001)和交叉熵损失函数进行训练,批量大小为16,梯度累积步长为4,共训练50个周期。
分类性能分析
HICNN模型在两个数据集上均表现出卓越性能。在Hema-DA数据集上达到99.5%的准确率,所有类别的精确度、召回率和F1分数均在0.98-1.00之间。在Hema-DB数据集上获得98.0%的准确率,F1分数范围为0.97-1.00。模型在类别1(197个样本)和类别2(193个样本)等较大支持度的类别上仍保持0.99-1.00的指标,证明了其处理类别大小变化而无偏倚的能力。
训练动态和收敛行为
训练过程显示了稳定的收敛和强大的泛化能力。在数据集1上,训练和验证损失平滑下降,到第50个周期时最小验证损失为0.0058。验证准确率在最初几个周期内迅速上升,超过99%,到第50个周期时稳定在99.85%。在数据集2上,验证损失稳定在0.0126,验证准确率峰值达到99.65%,训练准确率紧密跟踪(差距≤0.3%),反映了在1,992个样本上的一致泛化能力。
混淆矩阵分析
混淆矩阵提供了详细的类别特异性性能评估。在数据集1中,矩阵显示所有四个类别(良性、早期、前期、进展期)近乎完美的分类性能。良性类别获得193个真阳性(TP)且无错误分类,表明对非癌细胞的完美特异性。早期类别同样表现优异,达到195个TP和0个假阴性(FN),这对于确保早期诊断至关重要。
在数据集2中,嗜酸性粒细胞类别获得472个TP,但显示出有限的混淆,有27个实例被误分类为中性粒细胞。淋巴细胞类别保持高可靠性,达到492个TP(98.4%召回率),确保早期病例漏诊最少。单核细胞类别表现优异,达到496个TP(100%准确率),而中性粒细胞类别实现完美精确度(500个TP,100%)。
预测概率分布
预测概率密度分布为模型在四个诊断类别上的置信度和校准提供了关键见解。在数据集1中,密度曲线在预测概率范围(0.0-1.25)的极端附近显示出尖锐、分离良好的峰值。良性类别(类别0)在1.0附近显示最高密度,分布范围最小,表明在识别非癌细胞方面具有强置信度。
在数据集2中,密度分布更紧密,限制在0.0-1.0范围内,与预期概率界限一致。嗜酸性粒细胞类别(类别0)在1.0附近呈现尖锐峰值(密度≈1.2),而进展期类别(类别3)集中在0.8-1.0附近,反映了数据集1的高置信度趋势。
校准评分
两个数据集的Brier评分量化了所提出模型的概率校准,反映了预测概率与真实结果之间的一致性。较低Brier评分(接近0)表示预测具有更高置信度和可靠性,对临床决策至关重要。
数据集1获得总体Brier评分0.0019,显示近乎完美的校准。类别特异性评分显示进展期(Pro,类别3:0.0006)和前期(Pre,类别2:0.0008)类别表现异常优异,表明在区分晚期和过渡期癌症阶段时不确定性最小。早期(类别1:0.0029)和良性(类别0:0.0032)类别的评分略高,表明这些类别的预测变异性稍大,可能是由于早期恶性肿瘤与非癌细胞之间的形态学细微重叠所致。
数据集2显示略高的总体Brier评分0.0069,与其较大规模和固有变异性一致。值得注意的是,单核细胞类别(类别2)获得完美Brier评分0.0001,突显了模型在识别前期细胞方面的完美置信度。
消融研究
为了实证验证HICNN混合架构的贡献,研究进行了消融研究,比较三种配置:仅逆卷积模型、仅卷积模型和提出的HICNN模型。结果表明,HICNN在Hema-DA上达到99.5%准确率,显著优于仅逆卷积(96.8%)和仅卷积(97.5%)模型。在Hema-DB上,HICNN达到98.0%准确率,相比之下仅逆卷积为95.2%,仅卷积为96.5%。HICNN的较低Brier评分(Hema-DA为0.0019,Hema-DB为0.0069)表明更好的校准,反映了其产生自信和可靠预测的能力。
Grad-CAM可视化
Grad-CAM(梯度加权类激活映射)可视化突出了图像中对模型预测最具影响力的区域,为了解模型的决策过程提供了见解。图10显示了四个Hema-DB类别的Grad-CAM热图:(a)单核细胞,(b)中性粒细胞,(c)淋巴细胞,和(d)嗜酸性粒细胞,突出了模型对每个类别关键特征的关注。
图11显示了四个Hema-DA类别的热图:(a)早期,(b)前期,(c)进展期,和(d)良性,进一步证明了模型对诊断相关区域的关注。在早期、前期和进展期类别(图11a-c)中,热图显示了视野内多个细胞上激活的更广泛分布,反映了这些样本的异质性特征和处于不同发育阶段的细胞存在。
与最先进方法的比较
提出的HICNN模型在血细胞类型和阶段分类方面表现出优于现有最先进方法的性能。在数据集1上,HICNN达到99.5%的准确率,精确度、召回率和F1分数均为1.00,优于所有比较方法。在数据集2上,HICNN保持稳健性能,准确率为98.0%,平衡精确度、召回率和F1分数均为98.0,超过了大多数现有方法。
跨数据集评估和泛化性分析
为了评估模型在主要数据集之外的泛化性和稳健性,研究在独立公共基准上进行了跨数据集评估。选用的血细胞图像数据集(来自Kaggle)包含1,816张四种血细胞类型的显微镜图像:嗜酸性粒细胞(623样本)、中性粒细胞(666样本)、淋巴细胞(284样本)和单核细胞(243样本)。模型在该数据集上表现出卓越性能,总体准确率达到100%。类别分析显示,嗜酸性粒细胞实现完美精确度(1.00)和99%召回率,而单核细胞尽管是最小类别,但表现出完美召回率(1.00)和99%精确度。
研究结论表明,混合逆卷积-卷积神经网络通过协同整合逆卷积层的空间感知特征提取和卷积运算的平移不变层次学习,解决了血液学图像分析中的关键挑战。模型在白血病分期和白细胞亚型分类任务中均表现出卓越性能,校准分析显示类别间预测重叠最小,训练动态显示快速收敛和稳定泛化。该框架在癌症分期和细胞亚型分类任务中的强大性能,显示了在减少诊断模糊性和改进白血病及相关血液疾病早期检测方面的潜力。
尽管HICNN具有优势,但仍存在一些局限性。Hema-DA和Hema-DB数据集可能无法完全捕捉真实世界的临床变异性。需要在多机构数据集上进行验证。混合架构的计算复杂性可能阻碍在资源受限环境中的部署。未来工作将在多样化数据集上验证模型,优化效率,并增强可解释性。该研究为血液学诊断自动化提供了重要技术支撑,对推动精准血液病诊断具有重要临床意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号