基于自监督学习的高通量高内涵细胞分割新方法：突破自动化与通用性瓶颈

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月23日 来源：Communications Biology 5.2

编辑推荐：

　　为解决高通量细胞成像中依赖人工标注数据、计算复杂度高及模型泛化性差等问题，Van K. Lam团队开发了一种创新的自监督学习（SSL）像素分类算法。该方法通过高斯模糊与光流（OF）技术实现无标注数据的自动化训练，在多种显微镜模态（如相位差、荧光）和细胞类型（如MDA-MB-231、酵母）中均表现出色，F1分数达0.771-0.888，优于Cellpose（CP）且无需参数调优。该研究为药物开发、细胞治疗等高通量分析提供了高效工具，成果发表于《Communications Biology》。

论文解读

研究背景与挑战
在药物开发和细胞生物学研究中，高通量显微成像技术（如384/1536孔板）正以前所未有的速度生成海量数据。然而，传统基于深度学习的细胞分割方法（如U-Net、Mask R-CNN）面临四大瓶颈：依赖大规模标注数据集、需人工干预调参、计算资源消耗高，以及跨模态泛化能力不足。例如，Cellpose（CP）虽引入“人机交互”功能提升分割精度，却牺牲了自动化效率。更棘手的是，高分辨率成像（如63X物镜）虽能捕捉亚细胞结构（如丝状伪足），但现有算法难以兼顾通量与精度，迫使研究者在“样本量”与“分辨率”间妥协。

研究方案与创新
美国海军研究实验室等机构的研究团队提出了一种自监督学习（SSL）框架，通过单帧图像的高斯模糊生成“伪运动”光流场（OF），结合熵（e）、梯度（g）和强度（i）特征实现像素级分类。该方法突破性地摆脱了预训练数据依赖，仅需用户原始图像即可自动构建分类模型，适用于固定/活细胞、荧光/无标记等多种成像模式。

关键技术方法

自监督标签生成：对原始图像施加高斯模糊（σ=0.1），通过Farneback算法计算原始图与模糊图间的OF位移场，区分细胞与背景像素。
特征提取与分类：基于熵（纹理差异）、梯度和强度构建特征向量，采用朴素贝叶斯分类器（十折交叉验证）训练图像特异性模型。
性能评估：以F1分数（F1=TP/(TP+0.5×(FN+FP))）对比SSL与CP，并测试其在酵母聚团分割中的下游应用。

研究结果

跨模态与多细胞类型的通用性
SSL在10X-63X放大倍数下成功分割了乳腺癌细胞（MDA-MB-231）、人成纤维细胞（Hs27）和酿酒酵母（S. cerevisiae），涵盖相位差、微分干涉（DIC）、荧光等6种成像模态（图2）。例如，63X DIC下的酵母细胞伪足（<5μm）被精准捕获，而CP因需手动调整直径参数（150-330像素）导致漏检（图6）。

高内涵结构的识别优势
在纤维连接蛋白（5-100μg/ml）处理的Hs27细胞中，SSL无需调参即分割出低浓度组（5μg/ml）的延展伪足，而CP遗漏了30%的细胞（图4）。此外，SSL在63X共聚焦图像中识别出CP忽略的丝状伪足（图5），F1分数稳定在0.852±0.017，显著高于CP（0.804±0.08）。

大规模数据集验证
针对Cell Painting数据集（Hoechst染色核），CP因专用预训练模型（nuclei）表现更优（F1=0.953），但SSL在Hs27细胞（10X-60X）中仍以0.758-0.888的F1分数领先，且处理速度更快（表1）。例如，40X vinculin染色图像的处理时间仅3.02分钟，而CP需16.67分钟。

结论与意义
该研究通过SSL技术实现了“零标注”的高通量细胞分割，其核心创新在于：

自动化与普适性：单图像自适应建模消除了跨模态调参需求，尤其适合稀缺样本研究（如原代细胞）。
高内涵解析：熵特征强化了对亚细胞结构（如F-actin骨架）的敏感性，为表型筛选提供新维度。
可解释性：相比CNN“黑箱”，SSL的三大特征（e/g/i）可追溯分割决策依据，助力生物学机制研究。

未来工作将聚焦于粘附细胞解聚算法开发，进一步拓展其在生物制造质量控制等领域的应用。这一成果标志着计算生物学向“无监督、高保真”分析范式的重要跨越。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号