多样本非负空间因子分解(mNSF):无需对齐的空间转录组学数据分析新框架

【字体: 时间:2025年06月03日 来源:Genome Biology 10.1

编辑推荐:

  为解决多样本空间转录组数据因生物学变异和空间对齐困难导致的分析瓶颈,约翰斯·霍普金斯大学团队开发了多样本非负空间因子分解(mNSF)方法。该研究通过共享基因载荷和样本特异性空间因子建模,实现了无需空间对齐的多样本整合分析,在模拟数据和真实数据中验证了其识别解剖区域和生物学功能的能力,为跨平台、跨样本的空间组学研究提供了稳健工具。

  

研究背景与意义
空间转录组学(Spatially Resolved Transcriptomics, SRT)技术革命性地实现了基因表达的空间定位,但多样本分析面临严峻挑战。传统方法依赖样本间空间对齐,如同功能磁共振成像(fMRI)中的体素对齐,然而SRT样本常存在解剖区域不重叠、切片角度差异等问题,导致对齐失败。现有单样本空间因子分析方法如NSF(Non-negative Spatial Factorization)和MEFISTO无法直接扩展至多样本,而SpatialPCA虽支持非对齐样本但缺乏样本特异性参数建模。这一瓶颈严重限制了跨个体、跨平台的生物学发现。

研究团队与方法
约翰斯·霍普金斯大学公共卫生学院生物统计系的Yi Wang等研究者提出多样本非负空间因子分解(multi-sample NSF, mNSF),通过共享基因载荷矩阵wl和样本特异性高斯过程空间因子Fm,l,构建概率模型:Ym~NB(smΛmm),其中Λmlwlexp(Fm,l)。关键技术包括:(1)基于TensorFlow的自动微分优化;(2)诱导点(inducing points)和分块处理(chunking)降低计算复杂度;(3)使用Moran's I和泊松偏差评估空间依赖性。

研究结果
模拟数据验证
在旋转90°的模拟因子(T1-T4)中,mNSF准确匹配真实空间模式(M1-M4对应T2/T1/T4/T3),Moran's I>0.8证实空间依赖性。当T1因子在某个样本中缺失时,mNSF仍能识别样本特异性激活(M4仅在样本1高表达)。

小鼠矢状脑数据集
分析10X Visium获取的4个小鼠脑切片(前/后部各2个),20个因子中:

  • M9因子:特异性标记小脑(Pcp2+ Purkinje细胞),后部切片高表达;
  • M17因子:跨前后部连续分布,富集于海马CA1-3层(Cnih2+突触可塑性基因),揭示记忆与稳态调控的空间连续性。

人类DLPFC数据
12个样本(3供体×4切片)分析显示:

  • M6因子:特异性标记皮层2层(HPCAL1+兴奋性神经元);
  • M2因子:白质特异性(MOG+少突胶质细胞标记);
  • M5因子:供体间异质性(PLP1+髓鞘基因),反映解剖切面差异。

与空间对齐方法的比较
在DLPFC相邻切片(AB/CD对)中,mNSF与PASTE-NSF对齐后分析的层预测准确率相当(偏差<0.1),但对300μm间隔的BC切片,mNSF显著优于低映射评分的PASTE。

跨平台分析
整合Visium和小鼠Slide-seq数据时,mNSF通过5个域识别小脑区域,而SpatialPCA失效,证实其技术鲁棒性。

结论与意义
mNSF首次实现无需空间对齐的多样本SRT数据整合分析,其核心创新在于:

  1. 生物学解释性:通过共享基因载荷保留跨样本一致性,同时允许样本特异性空间变异;
  2. 计算优化:诱导点(35%空间点)和分块处理使GPU内存消耗与样本量线性相关;
  3. 应用普适性:适用于解剖不连续(如小鼠前/后脑)或技术异质性(Visium/Slide-seq)场景。
    该研究为阿尔茨海默病等疾病的跨个体空间异质性研究奠定方法学基础,相关代码已开源(GNU LGPLv3)。未来方向包括整合批次校正和半监督学习,以进一步提升临床转化价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号