基于增强的深度学习技术在循环肿瘤细胞识别中的应用

《Computers in Biology and Medicine》:Augmentation-based deep learning for identification of circulating tumor cells

【字体: 时间:2025年11月22日 来源:Computers in Biology and Medicine 6.3

编辑推荐:

  本研究提出基于bright-field成像和深度学习的循环肿瘤细胞(CTCs)分类方法,通过Parsortix和DEPArray技术实现单细胞分离与无标记检测,在测试集上达到F1-score 0.798,有效减少传统荧光标记带来的偏倚和泛化限制。

  在现代医学研究中,液体活检技术正逐渐成为一种重要的非侵入性诊断工具,其核心在于对循环肿瘤细胞(CTCs)的检测。CTCs是来源于原发肿瘤或转移部位并进入血液的细胞,它们作为肿瘤生物标志物,能够提供关于癌症进展、治疗反应和预后的重要信息。然而,由于CTCs在血液中的数量极为稀少且具有高度异质性,其准确识别和分类仍面临巨大挑战。传统的荧光标记方法虽然在某些情况下有效,但其依赖于特定的荧光标记物,这不仅增加了实验复杂性,还限制了其在不同医院数据集中的通用性。此外,手动分析CTCs图像不仅耗时,而且容易受到操作者主观因素的影响,从而影响诊断的一致性和准确性。

为了解决这些问题,本研究提出了一种基于深度学习(DL)的分类流程,利用明场(bright-field, BF)图像来区分CTCs和白细胞(leukocytes)。该方法结合了Parsortix?技术和DEPArray?技术,前者通过细胞的大小和变形性来无偏地富集CTCs,后者则能够精确地可视化和选择单个细胞。通过这种方式,研究团队能够获得高质量的单细胞图像,为后续的深度学习模型训练提供了丰富的数据基础。由于实际CTCs样本有限,研究中采用了数据增强技术,通过引入DAPI荧光通道的图像,增加了训练数据的多样性,从而提升了模型的泛化能力。在测试阶段,仅使用BF图像进行评估,以确保模型能够在不依赖荧光标记的情况下有效识别CTCs。

在实验设计中,研究团队构建了一个包含多种类型的图像数据集,包括模拟CTCs的细胞系图像、来自NSCLC患者的CTCs图像以及来自健康志愿者的白细胞图像。这些图像被分为训练集、验证集和测试集,其中训练集和验证集包含模拟CTCs的图像,而测试集则仅使用真实CTCs图像,以模拟实际临床环境。为了提高模型的泛化能力,研究团队采用了三种数据增强技术,包括仿射变换和颜色变换,同时将DAPI通道的图像纳入训练数据,以帮助模型学习CTCs的更多形态学特征。通过这种方式,最终的训练数据集从原始的782张图像扩展到了3910张图像。

在模型选择方面,研究团队评估了多种先进的卷积神经网络(CNN)架构,包括ResNet、EfficientNet和DenseNet。这些模型在处理复杂图像分类任务时表现出色,尤其在医学图像分析领域。研究中选择了ResNet34、ResNet50、EfficientNetB4和DenseNet121作为候选模型,并在相同的数据集上进行了训练和测试。其中,ResNet50表现最佳,达到了0.798的F1分数,显著优于其他模型。这一结果表明,ResNet50在平衡精确度和召回率方面具有优势,能够更有效地识别CTCs。

为了验证数据增强和DAPI图像在模型训练中的作用,研究团队进行了一系列消融实验。实验结果显示,仅使用BF图像进行训练的模型在F1分数上表现较差,而结合DAPI图像的模型则在多个性能指标上均有显著提升。这说明,虽然BF图像在测试阶段是关键,但DAPI图像在训练阶段对模型的学习和泛化能力至关重要。此外,研究还发现,数据增强策略对模型性能的提升具有重要影响,特别是在处理数据不足的情况下,增加数据的多样性有助于提高模型的鲁棒性。

统计分析方面,研究团队使用了非参数检验方法,如Mann–Whitney U检验,以评估不同数据增强策略对模型性能的影响。结果显示,结合DAPI图像的模型在F1分数上具有显著优势,进一步证明了其在提高模型泛化能力方面的重要性。这些统计结果不仅验证了模型的有效性,还强调了在CTCs识别任务中,结合多种图像模式和数据增强技术的必要性。

本研究的成果表明,基于深度学习的分类系统在CTCs识别中具有巨大潜力。通过结合无偏的细胞富集技术、精确的单细胞图像获取方法以及数据增强策略,研究团队成功构建了一个高效且准确的模型,能够有效区分CTCs和白细胞。这种方法不仅提高了诊断的准确性,还优化了临床工作流程,减少了对人工分析的依赖,从而提高了整体效率和可靠性。

未来的研究方向可能包括进一步优化数据增强策略,探索更高效的模型架构,以及在更大的临床数据集上进行验证,以确保模型的广泛适用性。此外,随着技术的进步,可能还会结合其他先进的图像分析方法,如迁移学习和自监督学习,以进一步提升模型的性能和泛化能力。通过这些努力,基于深度学习的CTCs识别技术有望成为液体活检领域的重要工具,为癌症的早期诊断和治疗监测提供更可靠的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号