
-
生物通官微
陪你抓住生命科技
跳动的脉搏
空间转录组解卷积方法在空间染色质可及性数据中的普适性验证
【字体: 大 中 小 】 时间:2025年07月16日 来源:Bioinformatics 4.4
编辑推荐:
本研究针对空间染色质可及性数据缺乏专用解卷积方法的现状,系统评估了五种空间转录组解卷积方法在ATAC-seq数据中的应用效果。研究人员开发了创新的模拟框架,通过金标准和银标准数据集验证发现Cell2location和RCTD方法在空间表观组学数据中保持稳健性能,为空间表观遗传学研究提供了重要方法学基础。该成果发表于《Bioinformatics》,为多组学空间分析建立了关键基准。
在生命科学研究领域,理解细胞如何在组织微环境中精确调控基因表达一直是重大挑战。虽然单细胞转录组和表观组技术揭示了细胞状态的异质性,但传统方法需要解离组织,丢失了关键的空间信息。近年来兴起的空间转录组技术虽然部分解决了这个问题,但对于基因调控的核心过程——染色质可及性的空间分布研究仍存在方法学空白。更棘手的是,现有空间染色质可及性检测技术(如Slide-tag和spot-based protocols)受限于分辨率,每个检测点包含多个细胞的混合信号,亟需有效的解卷积方法来解析细胞类型特异性模式。
来自德国慕尼黑工业大学(Technical University of Munich)和亥姆霍兹慕尼黑研究中心(Helmholtz Center Munich)的Sarah Ouologuem、Laura D. Martens等研究人员在《Bioinformatics》发表重要研究,系统评估了五种空间转录组解卷积方法在染色质可及性数据中的适用性。研究团队创新性地开发了双模态模拟框架,通过人类心脏和大脑单细胞多组学数据(银标准)以及黑色素瘤空间多组学数据(金标准),生成配对的转录组和ATAC-seq空间数据。研究重点评估了Cell2location、RCTD、Tangram、SpatialDWLS和DestVI五种算法,采用高度可变/高度可及性两种特征选择策略,通过RMSE和JSD等指标全面比较性能差异。
关键技术方法包括:1)基于人类心脏(704,296细胞)和大脑皮层(45,549细胞)单细胞多组学数据构建银标准模拟数据集;2)利用Slide-tag人类黑色素瘤空间多组学数据(2,529细胞)生成金标准数据集;3)采用Poisson-Gamma分布模拟组织异质性;4)评估两种ATAC-seq特征选择策略(高度可变峰值vs高度可及性峰值);5)使用SEML系统管理实验流程。
研究结果部分显示:
性能评估方面:Cell2location和RCTD在ATAC-seq数据解卷积中表现最优,JSD分别达到0.2037和0.2174,接近RNA数据的性能水平。Tangram的表现高度依赖参考数据集规模,在小规模参考时表现良好但随参考扩大而下降。SpatialDWLS和DestVI在ATAC数据上表现接近基线水平。

影响因素分析:高度可变峰值选择策略显著优于高度可及性峰值(P=0.007)。Cell2location在异质性组织中表现更稳健,而RCTD在均匀组织中略优。空间分区(zonation)对SpatialDWLS和DestVI影响较大,Cell2location在多重分区情况下保持稳定。
实际应用验证:在人类转移性黑色素瘤数据中,ATAC解卷积能准确识别肿瘤亚群(tumor 1和tumor 2)和免疫细胞浸润模式,但稀有细胞类型(如调节性T细胞)识别率低于RNA数据(F1分数:0.25 vs 0.4)。

研究结论指出,尽管ATAC-seq数据固有的稀疏性带来挑战,但Cell2location和RCTD能有效解卷积空间染色质可及性数据,性能与RNA数据相当。这为空间表观基因组学研究提供了重要方法学支持,避免了开发全新算法的需求。研究建立的模拟框架和性能基准将指导未来空间表观组学专用方法的开发。值得注意的是,RNA数据在稀有细胞类型解析上仍具优势,表明表观组解卷积仍有优化空间。该成果为多组学空间分析奠定了基础,推动了对组织微环境中基因调控机制的深入理解。
生物通微信公众号
知名企业招聘