SegDecon:基于HSV增强核分割与图像信息贝叶斯反卷积的空间转录组学新方法
《Computational and Structural Biotechnology Journal》:SegDecon bridges histology and transcriptomics through AI-based nuclei segmentation and image-informed spatial deconvolution
【字体:
大
中
小
】
时间:2025年10月27日
来源:Computational and Structural Biotechnology Journal 4.1
编辑推荐:
本文推荐SegDecon框架,该研究针对空间转录组学(ST)中细胞密度估计不准确导致反卷积偏差的问题,通过HSV色彩空间转换结合形态学滤波和StarDist实例分割提升核检测精度,并将图像衍生的核计数作为Gamma先验整合到改进的cell2location模型中。实验证明该方法在高分辨率小鼠脑数据中显著提升低丰度细胞类型的解析能力,为组织学与转录组学的整合提供可重复解决方案。
在空间转录组学迅猛发展的当下,科学家们能够以前所未有的精度观察组织中基因表达的空间分布。然而,一个关键难题始终困扰着研究人员:常用的技术平台如10x Genomics Visium,其每个捕获点(spot)的直径约为55微米,往往会覆盖多个细胞。这意味着每个spot测量到的是多个细胞的基因表达混合信号。为了解析这种混合信号,推断出每个spot内不同细胞类型的比例,计算反卷积技术应运而生。目前主流的方法,如cell2location、RCTD和Stereoscope,在估计每个spot的细胞总数时,通常采用固定或经验性的先验假设。这种简化处理忽略了一个基本生物学事实——组织中不同区域的细胞密度存在显著差异。例如,大脑皮层与白质区域的细胞密集程度截然不同。因此,假设均匀的细胞密度可能会严重扭曲对细胞类型组成的生物学解读,尤其对于低丰度或空间分布受限的细胞类型。
与此同时,标准的苏木精-伊红(H&E)染色组织切片图像提供了宝贵的形态学信息,理论上可以用于估计局部细胞密度。然而,从这些图像中实现精准、稳健的细胞核分割充满挑战。低对比度、染色不均、复杂背景以及细胞核的重叠和形态不规则等问题,常常导致传统分割方法效果不佳。在标准分辨率的Visium数据中,分割的不稳定性会削弱基于图像的先验信息的可靠性,进而降低反卷积的准确性。尽管组织学图像在估计细胞密度方面潜力巨大,但现有的空间转录组反卷积工具很少明确地将点水平的形态学信息整合到其模型中。
为了攻克这一难题,由Yuesi Xi、Xun Jiang、Jonas C. Schupp、Cheng-Jian Xu和Yang Li组成的研究团队开发了SegDecon——一个创新的计算框架。该框架通过人工智能驱动的细胞核分割和图像信息化的空间反卷积,成功搭建了组织学与转录组学之间的桥梁。这项意义重大的研究成果发表在《Computational and Structural Biotechnology Journal》上。
SegDecon的核心思路清晰而巧妙:首先,通过先进的图像处理技术从H&E染色图像中获取精确的每个spot的细胞核数量估计;然后,将这些图像衍生的细胞密度信息作为经验性的先验知识,整合到一个改进的贝叶斯反卷积模型中,从而引导模型得出更贴近生物学现实的细胞类型组成估计。为了验证SegDecon的有效性,研究人员主要利用了10x Genomics Visium HD小鼠脑数据集,并通过聚合高清捕获点(bin)生成了模拟标准Visium分辨率的“伪点”(meta-Visium)数据,从而能够在已知真实结构的数据上进行严格评估。
研究人员为开展此项研究,主要运用了几项关键技术:1. 图像预处理与增强:采用HSV(Hue-Saturation-Value)色彩空间转换、形态学滤波和基于色调的噪声掩模技术来优化H&E图像质量;2. 细胞核实例分割:使用深度学习模型StarDist进行精确的细胞核分割,并利用手动标注的细胞核中心点作为金标准进行评估;3. 空间映射与计数:将分割出的细胞核通过几何相交映射到空间转录组spot上,获得每个spot的图像衍生细胞核计数;4. 贝叶斯反卷积模型:在cell2location模型框架基础上进行修改,引入基于图像衍生细胞核计数矩匹配(moment-matching)估计出的Gamma先验(形状参数κ,速率参数θ)来约束spot的总细胞丰度。
研究结果表明,将H&E图像从RGB转换到HSV色彩空间能有效利用色调(Hue)通道分离细胞核与背景,提升对比度。结合StarDist深度学习分割模型,SegDecon流程在不同数据集(内部Visium HD-FFPE和外部CytAssist新鲜冷冻切片)上均表现出色,显著降低了切片水平的绝对计数误差。通过提出的H&E伪影严重程度评分(HASS)对组织区域进行分层后,发现SegDecon相较于单独的StarDist模型,在所有伪影水平下均有更低的误差,尤其在伪影严重区域改善最为显著。
通过逐一关闭预处理流程中的各个模块(如禁用S/V的MAD约束、强制使用分位数回调、禁用小物体过滤等),研究人员系统评估了每个步骤的贡献。结果表明,移除小物体过滤步骤对计数准确性负面影响最大,而其他步骤的调整影响相对较小,证明了默认配置下的SegDecon预处理流程具有较好的稳健性。
头对头评估显示SegDecon优于StarDist和Spotiphy
在匹配的组织切片上,SegDecon与StarDist和另一种整合组织学信息的方法Spotiphy进行了直接比较。结果显示, across all ground-truth density quartiles (Q1-Q4),SegDecon的细胞核计数误差中位数和变异性均低于对比方法。Bland-Altman分析也表明SegDecon的偏差更接近零,且一致性界限更窄。视觉上,SegDecon产生的分割掩模伪影更少,边界更贴合细胞核形态。
将图像衍生的细胞核信息整合进反卷积模型,显著提高了推断细胞类型分布的准确性和空间一致性。与高分辨率空间转录组(HD-ST)注释的金标准相比,SegDecon在主要细胞类型上显示出最高的相关性,优于cell2location和Spotiphy。回归分析表明,SegDecon的预测值与真实值之间线性关系更紧密,置信区间更窄,特别是对于低丰度或空间受限的细胞类型。空间重建图显示,SegDecon能更清晰地再现组织微结构,细胞类型边界更符合解剖学预期。
综上所述,SegDecon研究通过将稳健的HSV色彩空间增强分割与图像信息化的贝叶斯反卷积模型相结合,有效解决了空间转录组学中因细胞密度估计不准导致的细胞类型反卷积偏差问题。其创新性在于明确分离了图像信息的作用边界——用于稳定细胞核检测和校准总细胞丰度的先验,而不直接干预基因计数的观测模型,这既提高了结果的生物学合理性,也保持了模型的解释性。该研究提供的是一种实用、可复现的解决方案,无需针对每个数据集进行繁琐的参数调整,即可显著提升空间转录组数据分析的分辨率和可靠性,为深入理解组织微环境中的细胞组织规律提供了强大工具。研究代码已在GitHub开源,将有助于推动该领域的进一步方法学发展和应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号