基于自监督学习的高通量高内涵细胞分割新方法:突破自动化与通用性瓶颈

【字体: 时间:2025年05月23日 来源:Communications Biology 5.2

编辑推荐:

  为解决高通量细胞成像中依赖人工标注数据、计算复杂度高及模型泛化性差等问题,Van K. Lam团队开发了一种创新的自监督学习(SSL)像素分类算法。该方法通过高斯模糊与光流(OF)技术实现无标注数据的自动化训练,在多种显微镜模态(如相位差、荧光)和细胞类型(如MDA-MB-231、酵母)中均表现出色,F1分数达0.771-0.888,优于Cellpose(CP)且无需参数调优。该研究为药物开发、细胞治疗等高通量分析提供了高效工具,成果发表于《Communications Biology》。

  

论文解读

研究背景与挑战
在药物开发和细胞生物学研究中,高通量显微成像技术(如384/1536孔板)正以前所未有的速度生成海量数据。然而,传统基于深度学习的细胞分割方法(如U-Net、Mask R-CNN)面临四大瓶颈:依赖大规模标注数据集、需人工干预调参、计算资源消耗高,以及跨模态泛化能力不足。例如,Cellpose(CP)虽引入“人机交互”功能提升分割精度,却牺牲了自动化效率。更棘手的是,高分辨率成像(如63X物镜)虽能捕捉亚细胞结构(如丝状伪足),但现有算法难以兼顾通量与精度,迫使研究者在“样本量”与“分辨率”间妥协。

研究方案与创新
美国海军研究实验室等机构的研究团队提出了一种自监督学习(SSL)框架,通过单帧图像的高斯模糊生成“伪运动”光流场(OF),结合熵(e)、梯度(g)和强度(i)特征实现像素级分类。该方法突破性地摆脱了预训练数据依赖,仅需用户原始图像即可自动构建分类模型,适用于固定/活细胞、荧光/无标记等多种成像模式。

关键技术方法

  1. 自监督标签生成:对原始图像施加高斯模糊(σ=0.1),通过Farneback算法计算原始图与模糊图间的OF位移场,区分细胞与背景像素。
  2. 特征提取与分类:基于熵(纹理差异)、梯度和强度构建特征向量,采用朴素贝叶斯分类器(十折交叉验证)训练图像特异性模型。
  3. 性能评估:以F1分数(F1=TP/(TP+0.5×(FN+FP)))对比SSL与CP,并测试其在酵母聚团分割中的下游应用。

研究结果

跨模态与多细胞类型的通用性
SSL在10X-63X放大倍数下成功分割了乳腺癌细胞(MDA-MB-231)、人成纤维细胞(Hs27)和酿酒酵母(S. cerevisiae),涵盖相位差、微分干涉(DIC)、荧光等6种成像模态(图2)。例如,63X DIC下的酵母细胞伪足(<5μm)被精准捕获,而CP因需手动调整直径参数(150-330像素)导致漏检(图6)。

高内涵结构的识别优势
在纤维连接蛋白(5-100μg/ml)处理的Hs27细胞中,SSL无需调参即分割出低浓度组(5μg/ml)的延展伪足,而CP遗漏了30%的细胞(图4)。此外,SSL在63X共聚焦图像中识别出CP忽略的丝状伪足(图5),F1分数稳定在0.852±0.017,显著高于CP(0.804±0.08)。

大规模数据集验证
针对Cell Painting数据集(Hoechst染色核),CP因专用预训练模型(nuclei)表现更优(F1=0.953),但SSL在Hs27细胞(10X-60X)中仍以0.758-0.888的F1分数领先,且处理速度更快(表1)。例如,40X vinculin染色图像的处理时间仅3.02分钟,而CP需16.67分钟。

结论与意义
该研究通过SSL技术实现了“零标注”的高通量细胞分割,其核心创新在于:

  1. 自动化与普适性:单图像自适应建模消除了跨模态调参需求,尤其适合稀缺样本研究(如原代细胞)。
  2. 高内涵解析:熵特征强化了对亚细胞结构(如F-actin骨架)的敏感性,为表型筛选提供新维度。
  3. 可解释性:相比CNN“黑箱”,SSL的三大特征(e/g/i)可追溯分割决策依据,助力生物学机制研究。

未来工作将聚焦于粘附细胞解聚算法开发,进一步拓展其在生物制造质量控制等领域的应用。这一成果标志着计算生物学向“无监督、高保真”分析范式的重要跨越。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号