CellSAM:基于提示工程的通用细胞分割基础模型突破跨域分割瓶颈
《Nature Methods》:CellSAM: a foundation model for cell segmentation
【字体:
大
中
小
】
时间:2025年12月09日
来源:Nature Methods 32.1
编辑推荐:
本刊推荐:针对细胞分割模型泛化能力差、标注成本高等问题,研究人员开发了基于Segment Anything Model (SAM)的通用细胞分割基础模型CellSAM。通过集成目标检测器CellFinder自动生成提示框,该模型在哺乳动物细胞、酵母和细菌等多种成像模态数据上达到人类水平的分割精度,并展现优异的零样本和少样本学习能力。这项工作为空间转录组学和活细胞成像等生物医学分析流程提供了统一、高效的分析工具。
在生命科学和医学研究中,细胞作为生物组织的基本单元,其精确分割是定量分析各类细胞成像实验的关键步骤。随着空间基因组学检测技术的突破,现代实验可同时获取活体或固定组织中103种蛋白质和104种RNA分子的位置与丰度数据。准确分割细胞能够将这些数据转化为可解释的蛋白质定位图和转录本丰度图谱,为健康和病变组织的生物学机制提供重要见解。然而,现有深度学习模型多为针对特定领域的专家模型,难以跨域泛化,且像素级标注成本高昂(约0.01美元/标签),严重限制了大规模应用。
为解决上述问题,加州理工学院David Van Valen团队在《Nature Methods》发表了题为“CellSAM: a foundation model for cell segmentation”的研究。该工作构建了基于Segment Anything Model (SAM)的通用细胞分割基础模型CellSAM,通过集成目标检测模块CellFinder实现自动提示生成,在多种细胞类型和成像模态下达到人类水平的分割精度。
关键技术方法包括:1)构建涵盖组织、细胞培养、酵母、H&E染色和细菌等6大类别的细胞分割数据集;2)基于Anchor DETR框架开发CellFinder目标检测器,利用SAM的ViT (Vision Transformer)骨干网络提取特征;3)采用两阶段训练策略,先训练检测器再微调SAM掩码解码器;4)在LIVECell数据集上评估零样本/少样本性能,并整合至空间转录组学分析流程Polaris和活细胞追踪算法。
研究人员从文献中收集了TissueNet、DeepBacs、BriFiSeg等10个公共数据集,涵盖荧光、明场、相差和质谱细胞术等多种成像模态,包含组织切片、酵母、细菌、细胞核等不同目标类型。通过严格去除训练集与测试集间的数据泄露,确保模型性能评估的准确性。最终数据集包含6个评估类别,其中细胞核类别单独使用Kaggle DSB数据集进行评估。
CellSAM通过CellFinder生成的边界框提示创建掩码
实验发现,使用真实边界框作为提示时SAM的分割性能显著高于点提示。为此,团队开发了基于Anchor DETR框架的CellFinder目标检测器,其采用集合预测范式,无需非极大值抑制(NMS),特别适合细胞图像中密集对象的检测。通过两阶段训练策略,先联合训练ViT骨干网络和CellFinder,再固定ViT权重并微调SAM颈部网络,有效缓解了特征分布偏移问题。
以F1误差(1-F1)为指标,CellSAM在10个数据集上的表现均优于通用型Cellpose模型(包括预训练模型cyto3和内部训练模型),且与仅在单个数据集上训练的专家型Cellpose模型性能相当。特别值得注意的是,CellSAM通用模型在所有数据类别中均保持优异性能,而Cellpose在通用训练模式下出现性能下降,这凸显了基础模型随数据多样性增加而保持性能的关键特性。
通过比较三名专家标注者之间以及标注者与CellSAM之间的一致性,发现CellSAM的输出与人类专家标注无显著差异(组织P=0.18,细胞培养P=0.49,酵母P=0.11,细菌P=0.90)。这表明CellSAM的分割结果已进入标注者主观偏好(如细胞边界厚度)造成的误差范围内。
在LIVECell数据集上的测试表明,CellSAM的零样本性能因细胞系而异,但仅需10个视野(102-103个细胞)的少样本学习即可显著提升多数细胞系的分割性能。然而,对于形态学与训练数据分布差异较大的细胞系(如SH-SY5Y),微调难以恢复性能,这可能反映了边界框提示策略的局限性。
在空间转录组学分析中,CellSAM与深度学习分析流程Polaris结合,成功处理了MERFISH和seqFISH数据,实现对基因表达的细胞级分配。在活细胞成像领域,CellSAM与细胞追踪算法联用,在HeLa细胞AMP激酶报告实验和酵母出芽细胞系追踪中,实现了长达120分钟的细胞行为定量分析。此外,通过结合u-Segment3D算法,CellSAM还能生成三维细胞分割结果,拓展至表皮类器官和 hypothalamic 组织的EASI-FISH数据分
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号