
-
生物通官微
陪你抓住生命科技
跳动的脉搏
空间转录组学中基于局部密度比较的异常检测方法Sardine及其在生物组织扰动分析中的应用
【字体: 大 中 小 】 时间:2025年07月16日 来源:Bioinformatics 4.4
编辑推荐:
本研究针对生物组织在疾病或扰动下细胞类型/状态空间分布变化的检测难题,开发了Sardine方法。通过空间局部密度估计比较不同条件下细胞状态的分布概率,解决了现有方法忽视空间信息或依赖启发式策略的局限。在模拟数据和真实Visium数据集(小鼠大脑皮层损伤/脊髓电疗)中,Sardine较现有方法更准确地识别出具有生物学合理性的空间异常区域,为空间转录组跨条件分析提供了新工具。
在生物医学研究中,理解疾病、药物处理或实验干预如何改变组织中细胞类型和状态的分布至关重要。传统单细胞RNA测序(scRNA-seq)虽能识别细胞状态变化,却丢失了关键的空间信息。而新兴的空间转录组学(ST)技术虽能保留空间坐标,但现有分析方法如STANDS和Vespucci要么依赖启发式策略,要么无法量化细胞状态在特定空间区域的概率变化。这种技术瓶颈使得研究人员难以精确捕捉生物扰动下空间局部化的转录组变化模式。
针对这一挑战,普林斯顿大学计算机科学系(Department of Computer Science, Princeton University)的Gary Hu等研究者开发了Sardine(空间表达流形异常区域检测)方法。该方法创新性地将空间局部密度比较与流形学习相结合,首次在统计学严格框架下解决了"空间局部化微分丰度区域问题(SDARP)"。研究成果发表于《Bioinformatics》,为跨条件空间转录组分析提供了新范式。
关键技术方法包括:1) 基于空间注册的多切片对齐技术;2) 构建数据流形图表达k近邻关系;3) 空间异常家族Rs定义局部区域;4) 图拉普拉斯正则化密度估计计算条件概率;5) Moran's I检验评估空间自相关性。实验数据涵盖模拟数据集(多变量正态分布/S曲线流形)和真实Visium数据(小鼠皮层损伤模型GSE226211、脊髓损伤电疗数据GSE184369)。
主要研究结果
模拟数据验证性能优势
通过设计"棋盘格"和"螺旋"空间异常模式,比较Sardine与MELD、Vespucci在AUROC和均方误差(MSE)上的表现。在100维特征的多变量正态分布模拟中,Sardine达到完美AUROC(1.0)和最低MSE(0.022),显著优于Vespucci(MSE=0.081)。在S曲线流形数据中,Sardine保持0.984的AUROC,而对比方法均低于0.5,证明其处理非线性流形的优势。

小鼠皮层损伤模型的生物学验证
在皮层穿刺伤模型中,Sardine准确锁定损伤区域(坐标空间左下角),其异常评分与反应性星形胶质细胞标志物(Pearson r=0.42)和小胶质细胞标志物(r=0.38)显著相关。基因集富集分析(GSEA)检出650个显著通路(FDR<0.05),包括"异常先天免疫"(FDR=2.2×10-16)等损伤相关表型,远超Vespucci(26个)和MELD(0个)。Moran's I指数(0.883)证实其空间连贯性最优。

脊髓损伤电疗的多条件分析
在四条件比较(SCI/EESREHAB/EESREHAB-walking/SCI-EES-walking)中,Sardine展现出独特优势:1) 在EESREHAB vs EESREHAB-walking比较中检出88个显著通路,包括"突触可塑性受损"(FDR=0.007)等神经修复相关条目;2) 多条件分析时通过密度估计归一化实现概率解释,各条件Moran's I指数均>0.8,保持空间一致性;3) 较Vespucci更清晰区分灰质中治疗响应区域。
结论与展望
该研究通过将经典空间扫描统计量(Kulldorff 1997)与流形学习相结合,建立了空间转录组跨条件分析的新框架。Sardine的创新性体现在:1) 首次严格定义SDARP问题;2) 开发不依赖组织学图像的纯计算解决方案;3) 支持>2条件的扩展分析。未来可探索方向包括:整合不同分辨率数据、开发动态空间异常家族Rs、与切片对齐算法联合优化等。开源实现(https://github.com/raphael-group/spatial_anomaly_detection)将促进其在肿瘤微环境、发育生物学等领域的应用。
生物通微信公众号
知名企业招聘