
-
生物通官微
陪你抓住生命科技
跳动的脉搏
空间多组学数据整合分析新框架SpaOmicsVAE:揭示组织空间异质性的深度学习利器
【字体: 大 中 小 】 时间:2025年09月04日 来源:Computational and Theoretical Chemistry 2.8
编辑推荐:
【编辑推荐】本研究提出创新性深度学习框架SpaOmicsVAE,通过变分自编码器(VAE)与双图神经网络架构,整合空间转录组(spatial transcriptomics)、空间表观组等多组学数据,突破传统方法在保留空间信息、处理数据稀疏性方面的局限,为解析胸腺T细胞发育、海马体表观调控等生物学过程提供新视角。
亮点
SpaOmicsVAE:基于模态内特征融合的空间多组学数据增强策略
空间多组学技术能同步获取样本内每个空间位点的多组学数据及其空间坐标信息。为深度挖掘空间位点的局部特征,本研究在SpaOmicsVAE模型中提出创新性数据增强策略——通过整合模态内特征关联性与空间结构信息,为每个采样点构建增强型特征表征。
SpaOmicsVAE整体架构
SpaOmicsVAE是通过整合基因表达、空间坐标和组织形态精确定义空间域的综合模型(图1A)。模型首先处理两种输入模态(如基因表达数据和蛋白质/染色质数据)及样本空间位置信息(图1B)。针对每个空间位点,模型通过计算特征相似性与空间邻近性增强原始数据特征:采用BallTree算法构建空间邻域图以保持组织架构,同时建立特征邻域图反映功能关联,最终通过自适应融合实现双图信息整合。
讨论
SpaOmicsVAE凭借双图神经网络架构和基于注意力的整合机制,在空间信息与多模态分子数据整合方面实现重大突破。变分自编码器(VAE)的引入不仅实现鲁棒的特征学习与降维,更有效应对数据稀疏和噪声挑战。相较于Seurat、totalVI等现有方法,该框架在空间域识别精度、生物关系保留等方面展现出显著优势。
伦理声明
本研究未涉及人类参与者或动物实验,无需伦理审查批准。
数据与代码可用性
所有数据均为公开资源:10x Visium人淋巴结数据来自GEO数据库(编号GSE263617);验证数据集采用SpatialGlue描述的模拟数据;空间表观-转录组数据源自Zhang等2023年研究(可通过AtlasXplore平台获取);小鼠脾脏SPOTS数据来自......
作者贡献声明
张智伟:综述撰写/初稿撰写/可视化/验证/监督/软件/资源/项目管理/方法论/调研/形式分析/数据管理/概念化;王梦秋:综述撰写/初稿撰写/可视化/验证/监督/软件/调研/形式分析/数据管理/概念化;张欣欣:综述撰写/初稿撰写......
(注:翻译严格遵循原文结构,专业术语如BallTree、VAE等保留英文缩写并添加中文注释,技术细节如"空间邻域图"等采用生物学常用表述,同时保持科学性与可读性平衡)
生物通微信公众号
知名企业招聘