编辑推荐:
白血病早期诊断难且传统方法依赖专家经验、耗时长。研究人员开发白血病分类系统(LCS),融合图像处理、特征提取与选择及分类阶段,采用维度阿基米德优化算法(DAOA)和集成分类器(EC)。结果显示 LCS 性能优于传统方法,为白血病精准诊断提供新工具。
白血病是严重威胁人类健康的血液系统恶性肿瘤,其特征为白细胞异常失控增殖,影响骨髓造血功能并累及多器官。早期准确诊断对患者预后至关重要,但传统诊断依赖骨髓样本分析和专家镜检,存在耗时、成本高、主观性强等问题,且症状与其他疾病重叠导致早期识别困难。随着医疗数据激增,传统分析方法难以满足需求,机器学习(ML)和人工智能(AI)技术为解决这些挑战提供了新方向。
为实现白血病的高效自动分类,埃及尼罗河工程技术高等学院与荷鲁斯大学的研究人员开展了相关研究,开发了白血病分类系统(Leukemia Classification System, LCS),并在《Scientific Reports》发表成果。该研究通过整合图像处理、特征工程和智能算法,显著提升了白血病诊断的准确性和效率,为临床辅助诊断提供了创新工具。
研究主要采用以下关键技术方法:
- 图像处理阶段(IPS):对输入血液涂片图像进行预处理,包括调整尺寸至 500×500 像素、对比度增强、高斯滤波降噪及中值 / 维纳滤波平滑处理,以提升图像质量。
- 图像分割阶段(ISS):利用 K-means 算法分离白细胞(WBCs)、红细胞和血小板,结合标记控制分水岭算法分割重叠细胞核,通过边界清理去除不完整细胞结构。
- 特征提取阶段(FES):提取纹理特征(灰度共生矩阵 GLCM,22 个特征)和形态学特征(核 / 细胞质面积、周长、圆度等),融合后用于后续分析。
- 特征选择阶段(FSS):引入维度阿基米德优化算法(DAOA),结合阿基米德优化算法(AOA)和维度学习策略(DLS),通过二进制编码筛选关键特征,减少冗余并提升分类效率。
- 分类阶段(CS):采用集成分类器(Ensemble Classifiers, EC),结合随机森林(RF)、决策树(DT)、梯度提升(GB)和自适应增强(AdaBoost),通过最大投票机制确定最终分类结果。
实验结果与结论
- 数据集与评估:使用公开 ALL 数据集(3256 张外周血涂片图像,含良性造血祖细胞和三种恶性亚型),按 70% 训练、30% 测试划分。通过混淆矩阵计算灵敏度、准确率、F1 分数等指标,验证模型性能。
- DAOA 性能对比:与哈里斯鹰优化(HHO)、灰狼优化(GWO)等传统元启发式算法相比,DAOA 在准确率(97.8%)、精确率(87%)、召回率(80.1%)和 F1 分数(81.2%)上表现更优,证明其特征选择的有效性。
- LCS 整体性能:与现有方法(如 HM、CNN-ECA、DeepLeukNet 等)相比,LCS 在准确率(99.2%)、精确率(90.5%)、特异性(89.9%)、灵敏度(89%)和 F1 分数(89.7%)上显著提升,误差低至 0.8%,Dice 相似系数(DSC)和 Jaccard 指数(JI)分别达 98% 和 96.5%,显示出更强的分类能力。
- 消融研究:验证各组件重要性,发现同时使用纹理与形态学特征、DAOA 特征选择和集成分类器时性能最佳,单一特征或传统选择方法均导致指标下降。
讨论与意义
该研究提出的 LCS 通过 DAOA 有效融合全局与局部搜索能力,结合集成学习提升分类鲁棒性,为白血病自动化诊断提供了高效解决方案。尽管依赖高质量标注数据且对罕见细胞类型泛化能力有限,但研究结果表明,AI 驱动的医学影像分析可显著辅助病理学家,尤其在资源有限地区具有重要应用价值。未来可进一步结合生成对抗网络(GANs)处理数据不平衡问题,或整合多模态数据(如免疫表型、临床元数据)提升诊断全面性。
总之,该研究通过跨学科技术整合,为白血病精准医疗提供了创新工具,推动了 AI 在血液肿瘤诊断中的临床转化,具有重要的科学意义和实际应用潜力。