
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CNN-Transformer混合框架的血液细胞智能分类:迈向自动化血液学分析新纪元
【字体: 大 中 小 】 时间:2025年08月11日 来源:CMES - Computer Modeling in Engineering and Sciences
编辑推荐:
研究人员针对血液细胞形态学分类中局部特征提取与全局上下文建模的难题,创新性地提出融合CNN与Vision Transformer的混合框架。通过整合ResNet50、EfficientNetB3、InceptionV3等预训练模型与ViT模块,在17,092张血液细胞图像上实现97.66%的加权准确率,显著提升对嗜碱性粒细胞等相似亚型的区分能力(类间混淆率仅1.32%)。该研究为白血病自动化诊断提供了高精度、高效率的基线模型。
在临床血液学诊断领域,准确区分正常血液细胞类型是识别白血病等恶性疾病的基础。然而,传统人工镜检存在主观性强、效率低下等问题,而现有深度学习模型在捕捉细胞全局形态特征方面仍有局限。尤其对于沙特阿拉伯等白血病发病率持续上升的地区(2001-2014年儿童急性淋巴细胞白血病年增长率达4.58%),开发自动化分析工具迫在眉睫。
Najran University(纳吉兰大学)Department of Clinical Laboratory Sciences的研究团队在《CMES - Computer Modeling in Engineering and Sciences》发表研究,构建了四种CNN-Transformer混合模型。该研究采用Kaggle公开的17,092张正常血细胞图像数据集,包含嗜碱性粒细胞、淋巴细胞等8个类别。通过交叉模型参数共享和注意力引导的层剪枝技术,在保持精度的同时提升计算效率。
关键技术包括:1)多尺度特征融合策略整合CNN局部特征与ViT全局注意力;2)迁移学习结合渐进解冻策略优化预训练模型;3)基于ECE(预期校准误差)的概率校准确保临床可靠性;4)ROC曲线和混淆矩阵量化模型对形态相似细胞的区分能力。
研究结果显示:
分类性能:InceptionV3-ViT模型表现最优,宏观F1-score达0.98,对嗜碱性粒细胞(Class 0)分类精度达99%,显著优于现有EfficientNetB6等模型(97.16%)。
计算效率:训练时间较ResNet50-ViT缩短38.83%,仅需57.72分钟完成训练。
校准特性:模型预测概率与真实准确率高度吻合(ECE=0.019),避免临床决策中的过度自信误判。
生物学意义:成功区分核形态相似的嗜酸性粒细胞与中性粒细胞(混淆率1.32% vs 基线模型4.52%)。
该研究的创新性在于:首次将Inception模块的多尺度卷积与ViT的长程依赖建模相结合,克服传统CNN在池化过程中丢失空间信息的缺陷。通过注意力机制可视化发现,模型能自动聚焦于细胞核分叶、颗粒分布等诊断关键区域。
这项研究为血液病自动化筛查提供了新范式,其模块化设计支持扩展至白血病亚型分类。未来通过整合病理样本验证,有望实现从正常细胞分类到恶性病变检测的技术跨越,对医疗资源匮乏地区的早期白血病筛查具有重要应用价值。
生物通微信公众号
知名企业招聘