多尺度细胞互作空间转录组学(MCIST)分析:整合拓扑表征与深度学习的新范式

【字体: 时间:2025年09月17日 来源:Advanced Science 14.1

编辑推荐:

  本刊推荐:本文提出多尺度细胞互作空间转录组学(MCIST)分析方法,通过整合多尺度拓扑表征(kNN图谱)与前沿空间深度学习技术(STAGATE/SpaceFlow/GraphST),在37个基准数据集上验证了其在空间域检测(NMI提升11%)、轨迹推断(扩散伪时间分析)和差异基因表达(Welch's t-test)方面的卓越性能,为揭示细胞通信的多尺度特性提供了新范式。

引言背景

空间转录组学技术通过整合基因表达谱与空间位置信息,为理解组织病理学和功能提供了强大工具。现有分析方法主要聚焦基因表达与空间邻域关系,却忽略了生物学中至关重要的多尺度细胞间相互作用。细胞通信本质上包含短程接触、中程信号传递和长程相互作用等多个尺度,这种多尺度特性在当前的转录组分析中尚未得到系统研究。

方法创新

研究团队开发的多尺度细胞互作空间转录组学(MCIST)分析方法,创新性地结合了多尺度拓扑表征与空间深度学习技术。该方法首先通过不同k近邻(kNN)参数构建细胞互作图谱,采用高斯核函数计算边权重,形成多尺度细胞相互作用网络。随后利用持续拉普拉斯算子(persistent Laplacian)捕捉拓扑特征的稳定性,通过谱图正则化技术与非线性稀疏PCA相结合,产生多尺度"拓扑PCA"表征。

在空间信息整合方面,MCIST采用三种前沿深度学习模型:STAGATE(图注意力自编码器)、SpaceFlow(空间正则化深度图网络)和GraphST(图自监督对比学习),根据数据特性灵活选择。通过典型相关分析(CCA)对齐基因表达与空间表征,最终采用集聚类算法实现空间域检测。

数据规模与实验设计

研究涵盖了6种空间转录组技术的37个数据集,包括10x Visium、MERFISH、StereoSeq、STARmap、BaristaSeq和seqFISH等平台。数据规模从176到18,670个样本点,基因维度从79到33,538不等,聚类数量从4到18个类别,代表了当前空间转录组研究中最全面的基准测试集合。

性能验证

在LIBD背外侧前额叶皮层数据(12个切片)的测试中,MCIST结合GraphST实现了0.660的平均归一化互信息(NMI)分数,比基准GraphST提升近8%。在HER2阳性乳腺癌肿瘤数据的7个数据集中,MCIST(结合SpaceFlow)达到0.298的NMI分数,优于第二名方法47%。

总体而言,MCIST在37个数据集中,23个获得最佳聚类分数,33个进入前三名。与之前的最先进方法相比,MCIST在空间域检测方面提供了超过11%的性能提升。

生物学洞察

在背外侧前额叶皮层数据的轨迹推断分析中,MCIST成功揭示了神经发生的"由内向外"模式。以白质区域为根节点,伪时间值从内部白质区域向外层神经元层平滑增加,反映了最年轻的神经元迁移到最外层的生物学过程。PAGA图进一步显示了从WM簇到外层神经元层的连续连接,准确反映了预期的时间排序。

在HER2阳性乳腺癌肿瘤分析中,MCIST成功区分了健康乳腺组织、非浸润性癌和浸润性癌区域。通过扩散伪时间分析,以健康乳腺腺体点为根节点,伪时间值准确反映了从健康组织到非浸润性和浸润性肿瘤区域的预期进展轨迹。差异基因表达分析发现ERBB2在浸润性癌区域表达最强,SDC1在原位癌区域高表达,而B2M在免疫浸润区域富集。

技术适应性

MCIST在不同技术平台都表现出优异性能。在MERFISH小鼠下丘脑视前区数据(155个基因)中,MCIST准确识别了BST、MPA、MPN、PV等多个脑区结构。在BaristaSeq数据(79个基因)中,MCIST成功重构了大脑皮层的分层结构。在StereoSeq高分辨率数据中,MCIST成功处理了大样本量和高维度的挑战。

功能分析

通过基因集富集分析(GSEA),MCIST在乳腺癌数据中发现了上皮间质转化(EMT)、KRAS信号传导、Myc靶标和TNF-α信号等关键通路。这些通路在MCIST识别的空间域中显示出显著变化,而在基础深度学习方法识别的区域中未能检测到。

多尺度互作验证

研究还分析了配体-受体对在不同图谱配置中的富集情况,发现CRH-CRHR2在空间图中富集,GAD1-GABRA1在转录相似性图中富集,GAL-TH在中等尺度图中富集,而PNOC-OPRL1和SLC18A2-HTR2C在更大尺度图中富集,证明了细胞通信确实存在多尺度特性。

计算效率

在计算资源使用方面,MCIST与STAGATE结合时保持了较好的可扩展性。虽然在大型数据集(如seqFISH的19,000个细胞)上运行时间较长(约3小时),但在大多数数据集上保持了合理的计算效率。

结论展望

MCIST框架首次系统性地解决了空间转录组学中的多尺度细胞互作分析问题,为未来空间转录组研究设立了新标准。随着空间技术向更高分辨率和更高基因维度发展,MCIST的多尺度分析方法将更加重要。该方法不仅提升了空间域检测的准确性,还为理解细胞分化、肿瘤进展和组织发育等生物学过程提供了新的见解。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号