细胞分割作为战略决策制定

《Research》:Cell Segmentation as Strategic Decision Making

【字体: 时间:2026年06月02日 来源:Research 10.7

编辑推荐:

  成像型空间转录组学(spatial transcriptomics, ST)中的细胞分割依赖于染色图像分割或转录本聚类,但当前方法存在依赖人工注释、对染色质量和细胞密度敏感、以及缺乏与真实转录组图谱对齐等局限。研究人员提出RedeFISH,一种基于强化学习(r

成像型空间转录组学(spatial transcriptomics, ST)中的细胞分割依赖于染色图像分割或转录本聚类,但当前方法存在依赖人工注释、对染色质量和细胞密度敏感、以及缺乏与真实转录组图谱对齐等局限。研究人员提出RedeFISH,一种基于强化学习(reinforcement learning, RL)的框架,将细胞分割表述为顺序战略决策过程。通过迭代优化转录本分配策略,RedeFISH使分割细胞的表达谱与单细胞表达谱对齐,实现最优分割。该方法实现了无染色、转录组指导的单个细胞划定,从而克服了现有方法的关键局限。在多个ST平台上的基准测试表明,与最先进方法相比,RedeFISH将分割细胞表达谱的余弦相似度(cosine similarity)平均提高9.7%,并将均方根误差(root mean squared error, RMSE)降低13.9%。它还将分割细胞与真实细胞区域的一致性提高19%,展示了更高的准确性和鲁棒性。RedeFISH进一步通过从单细胞RNA测序(scRNA-seq)数据的空间引导转移,从稀疏的ST测量中填充全转录组谱。全转录组覆盖能够对空间微环境(如小鼠肠道干细胞微环境)的关键调控因子进行无偏倚的原位优先级排序,并解锁了仅用一个样本描绘从起始到侵袭整个发育过程中全景分子和细胞变化的可能性,例如人类癌症。
**研究背景与问题**
成像型空间转录组学(ST)技术通过原位定位mRNA实现了亚细胞分辨率,但面临两个核心挑战:细胞分割依赖染色图像或转录本聚类,存在对人工注释、染色质量和细胞密度的敏感性,且分割结果常与真实转录组谱不一致;基因检测通量有限,难以进行全转录组分析。现有方法包括基于监督学习(如卷积神经网络CNN)、无监督聚类(如Baysor、Proseg)和迁移学习(如Cellpose-SAM、Stardist)等,但均存在依赖染色、需大规模标注数据、对组织异质性鲁棒性差或转录本分配错误等问题。为此,研究人员开发了RedeFISH——一种基于强化学习(RL)的框架,将细胞分割建模为顺序战略决策过程,无需染色图像即可实现转录组指导的细胞分割和基因填充。该研究发表于《Research》。

**关键研究方法**
RedeFISH采用策略梯度(policy gradient)强化学习框架,整合两个核心模块:①分割模块(Segmentation Module):基于分子空间坐标和基因特征,通过多模态融合架构计算分子与候选细胞的分配概率,并利用噪声距离分数(NDS)和中心距离分数(CDS)构建奖励函数;②解卷积模块(Deconvolution Module):利用scRNA-seq数据估计细胞类型级表达谱,通过可训练权重矩阵生成预测表达谱,并与分割模块的表达谱对比生成表达相似度(ES)和残差(ER),反馈至奖励函数。模型经500轮迭代优化,最后通过alphashape算法确定多边形细胞边界,并基于加权平均进行全转录组填充。样本队列包括人类非小细胞肺癌(CosMx平台)、人类乳腺癌(Xenium平台)、小鼠回肠(MERFISH平台)、小鼠脑(MERSCOPE和Stereo-seq平台)、小鼠肝(MERSCOPE平台)和人类肺癌(Xenium平台)等6个数据集。

**研究结果**
**1. RedeFISH的设计**
RedeFISH首次将RL引入ST细胞分割,通过状态(当前转录本分配配置)、动作(基于坐标和基因特征分配转录本)和奖励(分割细胞与单细胞参考的表达相似度)的迭代交互,学习最优分配策略。分割模块联合利用空间和表达模式,解卷积模块通过自适应调整参考谱减小批次效应,二者交替优化使分割收敛于生物学一致性。

**2. RedeFISH在多种ST平台上表现出稳健的优越性能**
在6个数据集上,从三个角度评估:分割细胞表达谱相似度、细胞边界一致性、填充基因准确性。与Baysor、Proseg、Cellpose-SAM、Stardist及基于染色的手动分割相比,RedeFISH在余弦相似度上平均提高9.7%,RMSE降低13.9%。在人类肺癌Xenium数据集上,RedeFISH与真实边界的交并比(IoU)敏感性和特异性分别比次优方法高19.5%和18.9%;细胞面积和周长密度分布与真实值的面积IoU分别高21.8%和20.4%。基因填充方面,随机遮蔽70%基因后,RedeFISH在多数数据集中余弦相似度超过0.8,RMSE低。细胞数量与染色方法一致,转录本分配率稳定,处理千万级转录本仅需2–3小时(单GPU)。在Stereo-seq(测序型ST)上也表现良好。

**3. RedeFISH实现精准的组织架构表征**
在人类乳腺癌Xenium数据集中,RedeFISH解析了B细胞、T细胞、侵袭性肿瘤细胞和导管原位癌(DCIS)细胞的空间分布,且与标记基因表达高度一致。在感兴趣区域(ROI)中,RedeFISH避免了染色图像导出的伪影(如过度推断中央导管区细胞),并对血管结构进行了清晰描绘;而Baysor、Proseg等方法存在过度碎片化或边界不清晰等问题。在人类非小细胞肺癌CosMx数据集中,RedeFISH准确捕获肿瘤细胞、上皮细胞、内皮细胞和免疫细胞分布,在三级淋巴结构(TLS)区域避免了Proseg中因表达式转移导致的错误分类。在小鼠回肠、脑、肝及Stereo-seq脑数据集中,RedeFISH均识别出与组织学一致的结构,优于其他方法。

**4. RedeFISH实现全转录组空间分析并揭示肠道干细胞微环境中的Wnt/β-catenin信号**
针对MERFISH小鼠回肠数据集(241基因),RedeFISH实现无染色分割并填充全转录组,识别出空间特异性基因。其中,由RedeFISH填充的Wnt3(非MERFISH测量)在潘氏细胞中高表达,而MERFISH测量的Fzd5在干细胞和祖细胞中高表达,空间分布揭示了潘氏细胞通过Wnt3–Fzd5信号轴维持肠道干细胞微环境的调控机制。

**5. RedeFISH通过全转录组空间分析揭示乳腺癌从DCIS到侵袭的进展**
在人类乳腺癌Xenium数据中,RedeFISH基于全转录组表达矩阵进行差异表达分析(DGE),发现CEACAM6和LASP1在DCIS中上调,MDM2和DCAF7在侵袭中上调,且后两者与乳腺癌预后显著相关。伪时间分析(Palantir)构建了DCIS #1→#2→#3→侵袭性肿瘤的转化轨迹,其中DCIS #3伪时间中位数(0.474)高于DCIS #1(0.198)。微环境分析显示,从DCIS到侵袭的转变伴随肌上皮细胞消失和血管内皮细胞增加,且在50 μm尺度内巨噬细胞募集增加。

**总结与讨论**
RedeFISH通过强化学习框架克服了现有方法对染色图像和手动注释的依赖,实现了转录组驱动的高精度细胞分割和基因填充,在多个ST平台和数据集上展现了鲁棒性。其解卷积模块和噪声采样策略增强了边界定界和形态学一致性。应用揭示了Wnt/β-catenin信号在肠道干细胞微环境中的空间调控机制,以及乳腺癌进展中MDM2、DCAF7的上调和微环境重塑。研究结论:RedeFISH不仅是一种高精度细胞分割工具,还通过全转录组输出赋能广泛下游分析,为发育生物学和肿瘤转化研究提供了新标准。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号