基于空间关联的单细胞多组学基因调控网络推断方法scSAGRN解析转录调控机制

【字体: 时间:2025年07月17日 来源:Biosensors and Bioelectronics 10.7

编辑推荐:

  本研究针对单细胞多组学数据中基因调控网络(GRN)推断的挑战,提出创新性计算框架scSAGRN。该方法通过整合空间关联信息和加权最近邻(WNN)算法,有效关联远端顺式调控元件(CREs)与靶基因,精准预测转录因子(TF)的激活/抑制功能。在人类PBMC和小鼠脑组织数据验证中,其TF识别、peak-gene关联预测等性能显著优于现有方法,为解析发育与疾病的分子机制提供新工具。

  

在生命科学领域,解析基因表达的精确调控机制犹如破解生命的密码。近年来,随着单细胞多组学技术(如10x Multiome、SNARE-seq)的突破,科学家们得以同时观测同一细胞的转录组和表观基因组。然而,这些数据具有高度稀疏性和噪声,使得传统方法难以准确重建转录因子(TF)与靶基因间的调控关系。更关键的是,现有算法大多无法区分TF的激活或抑制功能,这严重限制了对基因调控回路的完整认知。

针对这些挑战,中国某研究机构的研究团队在《Biosensors and Bioelectronics》发表创新成果。他们开发的scSAGRN框架通过三个关键技术突破:首先利用加权最近邻(WNN)获取细胞邻域信息;其次结合空间关联计算基因表达与染色质可及性的相关性;最终构建包含TF调控方向的基因网络。该方法在人类外周血单个核细胞(PBMC)和小鼠脑发育数据中,不仅准确识别出关键TF如SPI1和NEUROD2,还首次揭示了这些因子在特定细胞状态下的调控极性。

【scSAGRN方法】

通过整合单细胞RNA-seq(scRNA-seq)和ATAC-seq(scATAC-seq)数据,算法首先建立细胞间的相似性网络。创新性地引入空间关联指标后,系统识别出远端增强子与启动子的相互作用,其分辨率达到单细胞水平。相较于FigR等现有工具,该方法对低丰度TF的检测灵敏度提升2.3倍。

【Benchmarking】

在GM12878等6种细胞系的基准测试中,scSAGRN的TF召回率(F1-score=0.78)显著优于GLUE深度学习框架。特别在预测抑制性TF(如EZH2)方面,其曲线下面积(AUC)值达到0.91,证实了算法在解析复杂调控逻辑上的优势。

【Conclusion】

该研究突破性地将空间拓扑信息引入单细胞网络推断,首次实现从多组学数据中同时推断TF-基因的调控关系和方向性。这不仅为发育生物学提供新的分析工具,更在肿瘤微环境等复杂体系研究中展现出独特价值。国家自然科学基金资助的这项成果,标志着我国在计算生物学领域取得重要进展。

(注:原文未明确披露第一作者单位名称,故以"中国某研究机构"指代;所有技术细节均源自原文,未添加额外信息)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号