编辑推荐:
在血液疾病诊断中,血细胞自动分割与分类至关重要却面临挑战。研究人员开展 “Advanced Biomedical Imaging for Identifying Blood Cell Type” 研究,提出新框架和算法。模型准确率达 96.67% ,有助于提升诊断系统可靠性,辅助临床诊断。
在医学领域,血液检查是疾病诊断的重要手段。血细胞,包括红细胞(RBC)和各类白细胞(WBC),它们的特征变化能反映出身体的健康状况。例如,细菌感染、艾滋病、癌症以及血液相关疾病等,都会导致不同类型白细胞的改变 。通过分析血细胞来诊断疾病,就像是医生在茫茫的健康谜题中寻找关键线索。然而,目前血细胞分析面临诸多难题。手动进行细胞分割和计数不仅费力,而且准确性难以保证,就如同在复杂的迷宫中盲目摸索,可靠性大打折扣。同时,现有的相关研究存在局限性,很多研究无法同时进行血细胞的分割和分类,还有的缺乏图像预处理技术,对细胞核和红细胞的识别不够重视,甚至没有集成自动细胞计数功能。在这样的背景下,开展一项全面且有效的血细胞分析研究迫在眉睫。
为了解决这些问题,来自未知研究机构的研究人员进行了 “Advanced Biomedical Imaging for Identifying Blood Cell Type: Integrating Segmentation, Feature Extraction, and GraphSage Model” 的研究。研究人员提出了两种自动化方法来分析白细胞,一种是将白细胞图像分割为白细胞、红细胞并识别白细胞的细胞核,另一种是利用白细胞及其细胞核的临床重要特征对不同白细胞类型进行分类。最终研究得出,所提出的模型准确率达到了 96.67% ,这一成果对于提升诊断系统的可靠性和适用性意义重大,能更好地辅助临床医生进行疾病诊断,就像是为医生们提供了一把精准的 “手术刀”,帮助他们更准确地剖析病情。该研究成果发表在《Biomedical Engineering Advances》上。
研究人员开展研究用到的主要关键技术方法如下:
- 图像分割技术:利用多种图像预处理算法,对白细胞区域、红细胞和细胞核进行分割。如通过探索不同颜色空间(CMYK、HSV 等),选择合适的颜色通道进行处理,再结合高斯模糊、Otsu 阈值化等操作实现精准分割。
- 特征提取与选择:从白细胞区域和细胞核提取 24 个临床相关手工特征,合并数据集后共得到 48 个特征。利用随机森林特征重要性、信息增益和 Boruta 算法进行特征选择,确定了 37 个重要特征。
- GraphSage 模型构建:构建改进的 GraphSage 模型,通过聚合和采样节点邻域特征生成节点嵌入,采用均值聚合器,结合图卷积、正则化等操作进行白细胞分类。
下面来看看具体的研究结果:
- 评估指标:使用准确率(ACC)、召回率(Recall)、F1 分数、假阳性率(FPR)和假发现率(FDR)等指标评估模型性能。结果显示,GraphSage 模型的准确率为 96.67% ,召回率为 96.3% ,F1 分数为 96.45% ,假阳性率仅为 0.831% ,测试损失为 0.0743,表现优异。
- 性能分析:GraphSage 模型训练和验证损失曲线表明,模型学习能力强,在 100 - 150 次训练中未严格收敛,但 90 次训练后验证损失相对差异小于 1% ,继续训练对性能提升不明显,因此建议训练 100 次。该模型生成的节点嵌入有效,聚类能力优于 GCN 和 GAT,能更好地分离不同类型白细胞。
- 对比传统模型和不同图模型:与传统机器学习模型(如决策树、随机森林、XGBoost 等)和图模型(GCN、GAT)对比,GraphSage 模型在各项性能指标上均表现最佳,证明其在白细胞分类上的卓越能力。
- 对比现有文献:与现有研究相比,本研究使用 BCCD 和 PBC 两个数据集,不仅进行白细胞分类,还同时实现了分割和计数,且采用的图模型能利用特征关系,提升了预测可靠性,在多数情况下优于现有研究。
- 模型可解释性:集成 GNNExplainer 技术,研究模型的可解释性。通过确定关键子图和重要节点特征,可视化特征重要性和子图,帮助临床医生了解不同特征对不同白细胞类别的影响。
研究结论和讨论部分指出,本研究提出的创新自动化方法,能有效整合白细胞和细胞核信息,辅助临床诊断。改进的 GraphSage 模型在计算效率上优于传统深度学习方法,通过归纳框架和邻域采样策略降低了计算成本,适合处理有限训练样本的情况。然而,该研究也存在一些局限性,如模型对不同数据集的适应性依赖大量预处理和手动特征工程,在动态环境中的应用有限,未纳入真实世界的实施。未来研究可聚焦于开发自动特征生成方法,纳入时间信息,以提升模型在现实场景中的适应性和实用性。总体而言,这项研究为血细胞分析和疾病诊断开辟了新路径,其成果有望推动临床诊断技术的进一步发展,帮助医生更准确、高效地诊断疾病,为患者的健康保驾护航。