
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自监督学习的高通量高内涵细胞分割新方法:突破自动化与通用性瓶颈
【字体: 大 中 小 】 时间:2025年05月23日 来源:Communications Biology 5.2
编辑推荐:
为解决高通量细胞成像中依赖人工标注数据、计算复杂度高及模型泛化性差等问题,Van K. Lam团队开发了一种创新的自监督学习(SSL)像素分类算法。该方法通过高斯模糊与光流(OF)技术实现无标注数据的自动化训练,在多种显微镜模态(如相位差、荧光)和细胞类型(如MDA-MB-231、酵母)中均表现出色,F1分数达0.771-0.888,优于Cellpose(CP)且无需参数调优。该研究为药物开发、细胞治疗等高通量分析提供了高效工具,成果发表于《Communications Biology》。
研究背景与挑战
在药物开发和细胞生物学研究中,高通量显微成像技术(如384/1536孔板)正以前所未有的速度生成海量数据。然而,传统基于深度学习的细胞分割方法(如U-Net、Mask R-CNN)面临四大瓶颈:依赖大规模标注数据集、需人工干预调参、计算资源消耗高,以及跨模态泛化能力不足。例如,Cellpose(CP)虽引入“人机交互”功能提升分割精度,却牺牲了自动化效率。更棘手的是,高分辨率成像(如63X物镜)虽能捕捉亚细胞结构(如丝状伪足),但现有算法难以兼顾通量与精度,迫使研究者在“样本量”与“分辨率”间妥协。
研究方案与创新
美国海军研究实验室等机构的研究团队提出了一种自监督学习(SSL)框架,通过单帧图像的高斯模糊生成“伪运动”光流场(OF),结合熵(e)、梯度(g)和强度(i)特征实现像素级分类。该方法突破性地摆脱了预训练数据依赖,仅需用户原始图像即可自动构建分类模型,适用于固定/活细胞、荧光/无标记等多种成像模式。
关键技术方法
研究结果
跨模态与多细胞类型的通用性
SSL在10X-63X放大倍数下成功分割了乳腺癌细胞(MDA-MB-231)、人成纤维细胞(Hs27)和酿酒酵母(S. cerevisiae),涵盖相位差、微分干涉(DIC)、荧光等6种成像模态(图2)。例如,63X DIC下的酵母细胞伪足(<5μm)被精准捕获,而CP因需手动调整直径参数(150-330像素)导致漏检(图6)。
高内涵结构的识别优势
在纤维连接蛋白(5-100μg/ml)处理的Hs27细胞中,SSL无需调参即分割出低浓度组(5μg/ml)的延展伪足,而CP遗漏了30%的细胞(图4)。此外,SSL在63X共聚焦图像中识别出CP忽略的丝状伪足(图5),F1分数稳定在0.852±0.017,显著高于CP(0.804±0.08)。
大规模数据集验证
针对Cell Painting数据集(Hoechst染色核),CP因专用预训练模型(nuclei)表现更优(F1=0.953),但SSL在Hs27细胞(10X-60X)中仍以0.758-0.888的F1分数领先,且处理速度更快(表1)。例如,40X vinculin染色图像的处理时间仅3.02分钟,而CP需16.67分钟。
结论与意义
该研究通过SSL技术实现了“零标注”的高通量细胞分割,其核心创新在于:
未来工作将聚焦于粘附细胞解聚算法开发,进一步拓展其在生物制造质量控制等领域的应用。这一成果标志着计算生物学向“无监督、高保真”分析范式的重要跨越。
生物通微信公众号
知名企业招聘