MNiST:一个用于多尺度空间特征建模和空间中细胞景观解码的深度学习框架
《Knowledge-Based Systems》:MNiST: A Deep Learning Framework for Multi-Scale Spatial Feature Modeling and Cellular Landscape Decoding in Spatial
【字体:
大
中
小
】
时间:2025年08月09日
来源:Knowledge-Based Systems 7.6
编辑推荐:
空间转录组学分析框架MNiST通过双分支编码器Gmamba整合局部与长程依赖建模、切比雪夫多项式频率域特征提取及无监督对比学习,实现空间结构识别与细胞类型解码的统一优化。实验验证其在斑马鱼大脑发育和人类黑色素瘤数据集上显著优于现有方法,准确揭示细胞分化轨迹、免疫细胞聚集及肿瘤异质性等生物学模式。
空间转录组学(Spatial Transcriptomics, ST)作为一种新兴的高通量技术,通过保留组织中的空间信息,极大地拓展了我们对基因表达模式和细胞异质性的理解。这一技术能够揭示细胞在组织中的分布规律,帮助研究者更精确地解析组织结构与功能之间的关系。然而,尽管ST在生物医学研究中展现出巨大的潜力,现有的计算方法在建模长距离空间依赖性和整合频率域信息方面仍存在一定的局限性。这些限制可能影响模型对复杂组织中空间表达模式的准确重建,尤其是在解析组织边界和功能区域时表现不足。
在空间转录组学的分析过程中,两个核心任务尤为关键:一是空间结构的识别,二是细胞类型的解混。前者关注于在组织中定位和区分不同的功能区域,后者则旨在从混合的表达信号中推断出每个空间位置的细胞组成。传统的计算方法通常依赖于监督学习框架,需要预先定义的细胞类型注释,这在处理未知细胞类型或存在显著批次效应的数据集时显得不够灵活。此外,许多方法基于线性假设,难以捕捉复杂的非线性表达关系,这在组织结构复杂、细胞状态多样或信号漂移显著的场景下尤为明显。
为了克服上述问题,研究人员提出了一种新的深度学习框架——MNiST(基于Mamba的网络整合空间转录组学)。该框架通过结合状态空间建模、频率域分析和对比学习,实现对空间特征的高效提取和细胞景观的解码。MNiST的核心创新在于其双分支编码器结构(Gmamba),由卷积分支和空间Mamba分支组成。卷积分支专注于提取局部特征,能够捕捉细胞表达的细微变化和组织边界信息。通过多层卷积网络,该分支提高了模型对组织微环境中的细胞群落边界的敏感度,从而更好地识别局部异质性。
另一方面,空间Mamba分支则利用连续时间状态空间建模和查询门控机制,有效捕捉长距离的基因表达依赖性和信号传播过程。相比于传统的图卷积网络(Graph Convolutional Networks, GCNs)或图注意力网络(Graph Attention Networks, GATs),这种设计避免了受限于局部邻域聚合的问题,从而能够识别不同功能区域之间的非局部调控关系。这种双分支结构不仅提升了模型对局部和全局信息的处理能力,还增强了其在复杂组织结构中的适用性。
为了进一步提升模型的鲁棒性和准确性,MNiST还引入了一个基于Chebyshev多项式展开的频率域特征提取模块。该模块对空间表达信号进行多阶频率分析,捕捉多尺度的组织层次结构和边界信息。这种频率域分析有助于模型在处理噪声干扰和复杂组织结构时保持稳定性,从而提高空间结构识别的精度。通过结合这三个核心组件,MNiST能够从微观到宏观的视角系统分析空间转录组学数据,显著提升空间结构识别的准确性和可靠性。
在细胞类型解混方面,MNiST设计了一个无监督的嵌入对齐和一致性学习框架,旨在在没有先验细胞类型标签的情况下,准确推断每个空间位置的细胞组成。该框架的核心思想是建立空间转录组学嵌入与单细胞转录组学嵌入之间的跨模态映射,通过在共享的低维表达空间中对齐它们的结构和语义,提高细胞组成推断的准确性。具体而言,模型引入了一个可学习的映射矩阵,通过加权组合的方式将单细胞嵌入投影到空间嵌入空间。该矩阵被限制为概率归一化,确保其在生物学上的可解释性,并反映每个细胞类型在特定空间位置的比例。
在训练过程中,MNiST不仅通过重构损失优化全局表达映射的准确性,还引入了局部邻域内的对比损失,以强化表达连续性和局部一致性。这种方法有助于模型更好地捕捉空间微环境中的特征和组织梯度,从而提高细胞类型解混的性能。与传统的解混方法相比,该框架不需要预先定义的细胞类型注释,也不依赖于强线性假设,从而更好地适应未知细胞类型、表达漂移和显著空间异质性的场景。此外,通过在共享嵌入空间中建模,该框架有效避免了高维原始表达数据中的噪声、尺度不匹配和冗余特征,使得解混过程更加稳健和具有广泛适用性。
为了验证MNiST的性能和适用性,研究人员将其应用于多个空间转录组学数据集,包括人类前额叶皮层(DLPFC)数据、小鼠脑数据、轴突动物脑发育数据和人类黑色素瘤组织切片。这些数据集涵盖了从发育过程到疾病研究的多个方面,能够全面评估模型在不同生物背景下的表现。实验结果表明,MNiST在空间结构识别和细胞类型解混方面均优于当前最先进的方法。它能够揭示生物学上有意义的空间模式,如胚胎发育过程中的细胞分化轨迹、肿瘤组织中的免疫细胞聚集以及肿瘤异质性的空间分布。
这些发现不仅突显了MNiST的计算能力,还为理解复杂组织中细胞的空间组织和动态行为提供了新的视角。MNiST的广泛应用表明,它具有作为整合工具的潜力,能够同时处理空间结构识别和细胞类型解混这两个关键任务。通过统一的框架设计,MNiST能够有效捕捉细胞组成与空间分布之间的内在耦合关系,从而为空间转录组学研究提供更加全面和深入的分析手段。
在当前空间转录组学研究的背景下,MNiST的提出具有重要的意义。它不仅解决了传统方法在建模长距离空间依赖性和频率域信息方面的不足,还通过无监督学习策略提升了模型的灵活性和泛化能力。此外,MNiST的双分支编码器结构和频率域特征提取模块为处理复杂组织结构和高维数据提供了新的思路,使得空间转录组学分析更加高效和准确。未来,随着空间转录组学技术的不断发展,MNiST有望成为处理空间组学数据的重要工具,为揭示组织中的基因表达模式和细胞异质性提供更加全面的支持。
此外,MNiST在数据处理和模型设计上的创新也为后续研究提供了参考。例如,其对空间表达信号的多阶频率分析有助于更好地解析组织中的多尺度结构,而其无监督的嵌入对齐策略则为处理未知细胞类型和批次效应的数据集提供了新的解决方案。这些设计不仅提高了模型的性能,还增强了其在不同应用场景下的适应性。随着更多空间转录组学数据的积累,MNiST的潜力将进一步显现,为解析组织中的复杂生物学过程提供更加有力的工具。
总的来说,MNiST的提出为空间转录组学研究带来了新的突破。它通过结合状态空间建模、频率域分析和对比学习,实现对空间特征的高效提取和细胞景观的解码。这种统一的框架设计不仅提升了模型的计算能力,还增强了其在复杂组织结构中的适用性。MNiST的双分支编码器结构和频率域特征提取模块为处理高维数据和复杂空间依赖性提供了新的思路,使得空间转录组学分析更加全面和深入。未来,随着空间转录组学技术的不断发展,MNiST有望成为处理空间组学数据的重要工具,为揭示组织中的基因表达模式和细胞异质性提供更加有力的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号