双图正则化集成学习框架SMODEL:空间多组学数据中空间域解析的新范式

【字体: 时间:2025年06月22日 来源:Communications Biology 5.2

编辑推荐:

  本研究针对空间多组学数据稀疏性和分布异质性难题,提出基于双图正则化锚点概念分解的集成学习框架SMODEL。通过元素级加权集成策略整合多基聚类结果,结合空间位置约束与高阶拓扑信息,成功实现人类淋巴结、乳腺癌组织等复杂微环境中空间域的精准识别,为解析细胞异质性提供新工具。

  

空间生物学的新突破:SMODEL算法如何重塑多组学整合分析
随着空间转录组(spatial transcriptomics)、空间表观组(spatial epigenomics)等技术的快速发展,科学家们得以在保留细胞空间位置信息的同时获取多维分子特征。然而,数据稀疏性、技术噪声以及模态间分布差异,严重阻碍了对组织微环境中细胞异质性的系统解析。传统单细胞多组学整合方法(如scVI、MultiVI)往往忽视空间信息,而现有空间分析方法(如SpatialGlue、PRAGA)又难以平衡计算效率与生物学解释性。

为解决这一挑战,深圳大学的研究团队在《Communications Biology》发表题为"Unveiling spatial domains from spatial multi-omics data using dual-graph regularized ensemble learning"的研究论文,开发出SMODEL(Spatial Multi-Omics Domain Ensemble Learning)算法框架。该研究通过创新性地融合锚点概念分解(anchor concept factorization)与双图正则化约束,首次实现空间多组学数据的稳健集成与可视化解析。

关键技术方法
研究团队采用三阶段技术路线:1)基于k-means的锚点选择与非负矩阵分解构建跨组学低维表征;2)引入元素级加权策略(element-wise weighting)整合Seurat、MOFA+等7种基聚类结果;3)通过空间位置图(Euclidean distance-based graph)与高阶互信息图(PMI matrix)的双重约束,保留组织结构的几何流形特征。实验验证涵盖人类淋巴结(Visium平台)、小鼠乳腺癌(MMTV-PyMT模型)及模拟三组学数据,采用NMI、ARI等8项评估指标。

研究结果
基准测试验证性能优势
在人类淋巴结样本A1的10类结构注释中,SMODEL准确识别被膜(capsule)、皮质(cortex)和髓索(medulla cords)等关键区域(图2B)。定量评估显示其ASW值达0.184(图2D),DBI指数1.457(图2E),均显著优于SpatialGlue等基线方法。

乳腺癌微环境解析
应用至1978个spots的乳腺癌数据时,SMODEL成功捕获M2型巨噬细胞特征(Arg1+)在肿瘤边界的免疫抑制性分布(图3A)。生存分析显示其鉴定的Svopl(p<0.05)与Serpini1(p<0.05)分别作为乐观/悲观预后标志物(图3D-E),并通过JAK-STAT3通路阐释Lepr调控的M2极化机制(图3F)。

表观-转录组协同分析
在小鼠脑空间ATAC-RNA-seq数据中,SMODEL清晰区分皮层(CTX)分层结构与纹状体(Str),增强Pde10a(纹状体)、Mbp(胼胝体)等区域特异性基因表达信号(图4C)。

三组学整合能力
模拟实验证明SMODEL可自适应分配RNA(50.5%)、ATAC(30.7%)、ADT(9.5%)的模态权重(图5C),在90%稀疏度下仍保持稳定性(补充图5)。

结论与展望
该研究开创性地将集成学习引入空间多组学分析,其创新性体现在:1)通过锚点概念分解解决模态异质性;2)利用双图正则化保留空间拓扑结构;3)元素级加权策略提升基聚类可靠性。在淋巴结髓质结构识别、乳腺癌免疫微环境解析等场景中展现出超越现有方法的性能,为肿瘤免疫治疗靶点发现(如Lepr-STAT3轴)提供新思路。未来可通过整合H&E图像数据与连续切片分析,进一步拓展其在临床转化中的应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号