利用Contourlet变换和元启发式优化的深度特征,结合基于聚类的决策机制,提升多类血细胞分类的准确性
《Biomedical Analysis》:Enhanced Multiclass Blood Cell Classification Using Contourlet Transform and Metaheuristic-Optimized Deep Features with Clustering-Based Decision Making
【字体:
大
中
小
】
时间:2025年11月22日
来源:Biomedical Analysis
编辑推荐:
白细胞的混合框架通过轮廓变换提取多尺度方向特征,结合深度学习(LSTM)建模空间依赖,利用非洲秃鹫优化算法(AVOA)优化特征子集,并采用模糊聚类决策机制,显著提升多类白细胞分类的准确性和计算效率,尤其在处理数据不平衡的嗜碱性粒细胞时效果显著。
在医学领域,白细胞(WBC)的准确分类对于血细胞疾病的诊断和监测具有重要意义。例如,白血病、贫血和感染等疾病都需要通过血细胞的形态学分析来辅助诊断。然而,传统的人工分析不仅耗时费力,还受到观察者主观判断的影响,容易出现误判或漏判的情况。因此,开发一种自动化且可靠的白细胞分类方法成为计算机辅助诊断系统的关键任务。本文提出了一种新颖的混合框架,结合多尺度特征提取、深度学习、元启发式优化和基于聚类的决策机制,以实现对五种白细胞亚型(淋巴细胞、单核细胞、嗜酸性粒细胞、嗜碱性粒细胞和中性粒细胞)的稳健分类。该方法不仅提升了分类的准确性,还增强了模型的可解释性和计算效率,为临床部署提供了可行的解决方案。
### 方法概述
该方法主要包括四个关键步骤:(1)利用轮廓波变换(Contourlet Transform)进行多尺度和多方向的特征提取,以获取丰富的边缘和方向信息;(2)通过一个轻量级的卷积循环神经网络(CRNN)对特征进行深度序列学习,以捕捉空间和跨尺度的依赖关系;(3)引入非洲秃鹫优化算法(AVOA)进行最优特征选择,以增强模型的判别能力并减少计算复杂度;(4)通过基于模糊聚类的决策机制进行分类结果的优化,以提升分类的稳定性,特别是在处理形态学相似的细胞类型和小样本少数类时。
#### 多尺度特征提取
轮廓波变换是一种能够有效提取图像中方向性和边缘信息的多尺度变换方法。该变换由两部分组成:第一部分是拉普拉斯金字塔,用于多尺度分解;第二部分是方向滤波器组,用于角度分解。与传统的傅里叶变换和小波变换相比,轮廓波变换能够提供更丰富的方向选择性和更长的线性支持,这有助于更精确地捕捉细胞膜和细胞核边界等细节特征。通过计算每个子带的局部统计信息(如均值、方差、能量和局部熵),可以生成一个紧凑的描述符向量,从而为后续的深度学习提供高质量的输入。
#### 深度学习模型
为了捕捉图像中的空间和跨尺度依赖关系,本文采用了一个轻量级的卷积神经网络(CNN)作为基础架构,其输出结果被送入一个循环模块(如LSTM或GRU)。CNN负责提取图像中的高级特征,而循环模块则用于整合这些特征,并建模其时序关系。通过将轮廓波子带描述符按一定的顺序(如按尺度和方向排序)拼接,并与CNN的全局特征向量结合,可以生成一个具有判别能力的深度特征向量。这一特征向量不仅能够提升模型的表达能力,还能在保持计算效率的同时,减少冗余信息。
#### 特征选择与优化
特征选择是提高模型判别能力的重要环节。本文引入了非洲秃鹫优化算法(AVOA)作为特征选择的优化工具。AVOA是一种基于种群的元启发式算法,其灵感来源于非洲秃鹫的觅食和互动行为。通过将连续特征向量映射为二进制掩码,并使用轻量级分类器(如线性支持向量机或小规模多层感知机)进行快速评估,可以有效地筛选出对分类最有帮助的特征子集。这一过程不仅提升了模型的判别能力,还显著减少了计算复杂度,使模型更适合临床部署。
#### 基于聚类的决策机制
为了增强模型在处理重叠类和小样本少数类时的鲁棒性,本文引入了基于模糊聚类的决策机制。该机制首先在训练特征向量上进行聚类分析,以识别不同细胞类型之间的特征分布模式。然后,通过计算测试样本与聚类中心之间的距离,并结合聚类密度,生成每个类别的概率得分。最终,通过选择具有最高概率得分的类别,实现分类决策。这一方法不仅提高了分类的稳定性,还增强了模型的可解释性,使得分类结果能够被临床医生理解和验证。
### 实验结果与分析
本文在“江西铁道”数据集上进行了实验验证,该数据集包含了五种主要的白细胞类型:中性粒细胞、淋巴细胞、单核细胞、嗜酸性粒细胞和嗜碱性粒细胞。实验结果显示,所提出的混合框架在多个评估指标上均优于传统方法。具体而言,该模型在准确率、精确率、召回率和F1分数上均有显著提升,其中嗜碱性粒细胞的准确率从0%提升至约67%,这一结果表明该方法在处理数据不平衡问题上具有较强的鲁棒性。此外,模型的平均推理时间减少了约26%,这主要得益于AVOA的特征优化过程,显著提升了计算效率。
#### 混合模型的性能提升
在五类白细胞分类任务中,所提出的混合模型(Contourlet + CNN + AVOA + Clustering)在多个指标上表现优异。例如,准确率从95.1%提升至96.8%,精确率从94.86%提升至96.41%,召回率从94.74%提升至96.38%,F1分数从94.78%提升至96.42%。这些指标的提升不仅表明了模型在处理重叠类和少数类时的优越性,还反映了其在数据不平衡情况下的鲁棒性。特别是,模型在嗜碱性粒细胞分类上的显著改善,展示了其在识别罕见细胞类型方面的潜力。
#### ROC曲线与AUC分析
为了进一步验证模型的判别能力,本文还进行了受试者工作特征(ROC)曲线分析,并计算了面积下曲线(AUC)值。结果表明,所提出的混合模型在所有五种白细胞类型上的AUC均高于基线模型,其中嗜碱性粒细胞的AUC从0.67提升至0.91。这表明,通过AVOA优化和聚类决策机制,模型能够更有效地捕捉罕见细胞的形态学特征,并减少误判率。此外,模型在所有类别上的ROC曲线均表现出更高的灵敏度和特异性,这为临床应用提供了更可靠的分类依据。
### 临床意义与应用前景
本文提出的混合框架不仅提升了白细胞分类的准确性,还增强了模型的可解释性和计算效率。这些优势使得该模型能够在实际临床环境中得到应用,特别是在需要快速、可靠和自动化处理血涂片图像的诊断实验室。此外,该模型的高效计算能力使得其在资源有限的医疗环境中也具备良好的可行性。通过减少计算时间并提升分类的稳定性,该方法有助于缩短诊断流程,提高实验室的工作效率。
#### 模型的可解释性
为了确保模型在生物医学领域的可解释性,本文在特征和决策层面都进行了透明化处理。首先,通过可视化轮廓波变换的子带特征和深度学习网络的激活图,可以揭示模型在识别不同白细胞类型时所关注的形态学特征。其次,基于模糊聚类的决策机制能够将多个分类器的输出进行聚合,从而提升决策的可解释性。这种双重可解释性不仅有助于临床医生对模型输出的理解,也为模型的进一步优化和改进提供了理论依据。
#### 处理数据不平衡问题
在实际应用中,数据不平衡是一个常见的挑战,特别是在处理罕见细胞类型(如嗜碱性粒细胞)时。传统的卷积神经网络(CNN)往往对多数类(如中性粒细胞和淋巴细胞)表现出较强的分类能力,但对少数类的识别率较低。本文通过引入AVOA进行特征优化和聚类决策机制,有效增强了少数类的分类性能。这一策略不仅提升了模型的泛化能力,还为处理其他类似的数据不平衡问题提供了参考。
#### 未来研究方向
尽管本文提出的混合框架在多个方面表现出色,但仍存在一些需要进一步研究的改进空间。例如,未来可以扩展数据集的多样性,通过与临床实验室合作,增加不同样本和不同采集条件下的数据。此外,可以探索使用更轻量级的深度学习架构,如Transformer模型,以进一步提升模型的可扩展性。同时,模型在处理小样本少数类时仍存在一定的挑战,因此可以考虑引入数据增强和过采样技术,以提升模型在罕见类别上的表现。
### 总结
本文提出的混合框架通过结合多尺度特征提取、深度学习、元启发式优化和基于聚类的决策机制,为白细胞分类提供了一种高效、准确且可解释的方法。实验结果表明,该模型在多个评估指标上均优于传统方法,特别是在处理数据不平衡和形态学相似的细胞类型时表现突出。此外,模型的计算效率也得到了显著提升,使其在实际临床环境中具备良好的可行性。未来的研究将进一步探索模型的可扩展性和鲁棒性,以适应更广泛的医学应用场景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号