编辑推荐:
针对全监督细胞核分割需大量人工标注的问题,研究人员开展涂鸦监督的弱监督分割研究,提出 S2L-CM 框架,结合伪标签、多尺度对比正则化(MCR)和像素级多实例学习(pMIL)。在 4 个数据集上性能优于 SOTA,为病理分析提供高效方案。
在生物医学图像分析领域,病理图像的细胞核分割是肿瘤负荷评估、细胞比例计算等关键任务的基础。传统基于深度学习的全监督方法虽精度高,但需领域专家耗费大量时间绘制精确边界,尤其面对海量小细胞核实例时,标注难度显著增加。弱监督学习试图通过稀疏标注(如点、涂鸦、边界框)降低标注成本,然而现有方法中,点监督需逐个细胞标注且性能依赖标注位置,边界框监督因精度不足难以处理复杂形状,即便强大的基础模型 SAM 在细胞核分割中也表现欠佳。因此,开发一种高效、低标注成本且适用于病理图像的弱监督细胞核分割方法成为亟待解决的问题。
韩国高丽大学(Korea University)的研究人员开展了相关研究,提出 S2L-CM(Scribble to Label with Multiscale Contrastive and Pixel-level Multiple Instance Learning)框架,该研究成果发表在《Computers in Biology and Medicine》。
研究中采用的关键技术方法包括:
- 两阶段训练框架:热身阶段使用稀疏涂鸦标签训练网络;主阶段引入自生成伪标签、多尺度对比正则化(MCR)和像素级多实例学习(pMIL)。
- 伪标签生成:通过预测的迭代指数移动平均(EMA)生成伪标签,并以一致性阈值过滤,确保标签可靠性。
- 多尺度对比正则化(MCR):从网络解码器不同分辨率的中间块提取特征向量,以网络预测为标签进行监督对比正则化,增强特征表示的判别力。
- 像素级多实例学习(pMIL):缓解训练中预测噪声,提升伪标签质量。
研究结果
数据集与对比实验
在三个公共数据集(MoNuSeg、TNBC、CPM-17)和一个挑战数据集(PAIP2023)上,将 S2L-CM 与现有弱监督细胞核分割 SOTA 方法对比。结果表明,S2L-CM 在交并比(IoU)指标上显著优于其他方法,最高提升达 3.4%,验证了其有效性和鲁棒性。
消融实验
通过逐步移除框架中的关键组件(伪标签、MCR、pMIL),分析各部分对性能的贡献。实验显示,伪标签的迭代过滤机制、MCR 的多尺度特征对比以及 pMIL 的去噪作用均显著提升分割精度,证明各组件协同作用对整体性能至关重要。
研究结论与意义
S2L-CM 框架通过涂鸦监督结合伪标签生成、多尺度对比正则化和像素级多实例学习,有效解决了弱监督细胞核分割中标签稀疏性与噪声问题,在多种病理数据集上实现 SOTA 性能。该方法大幅降低人工标注成本,为组织病理学图像的自动化分析提供了高效可靠的工具,有望加速癌症诊断、治疗评估等临床应用的发展。研究同时表明,领域特定的弱监督策略(而非通用基础模型)在病理图像分割中更具优势,为后续医学图像分析研究提供了新方向。