基于自注意力机制和元学习的动态基因调控网络推断方法Marlene在单细胞时序数据分析中的应用

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  针对单细胞RNA测序(scRNA-seq)时序数据中动态基因调控网络(GRN)重建的挑战,卡内基梅隆大学团队开发了深度学习框架Marlene。该方法通过自注意力机制和门控循环单元(GRU)构建随时间演变的基因互作网络,结合元学习(MAML)解决稀有细胞类型分析难题,在COVID-19免疫应答、肺纤维化和衰老研究中成功识别关键调控通路,为疾病机制解析提供新工具。

  

基因调控是生命活动的核心过程,其动态特性在发育、疾病和应激响应中起关键作用。然而,传统基因调控网络重建方法多基于静态假设,难以捕捉生物系统随时间演变的本质。随着单细胞RNA测序(scRNA-seq)技术的普及,科学家们获得了前所未有的高维时序数据,但如何从中解码动态调控关系仍面临巨大挑战——现有算法在计算效率、细胞异质性处理和稀有细胞类型分析等方面存在明显局限。

卡内基梅隆大学(Carnegie Mellon University)机器学习系的Euxhen Hasanaj和Ziv Bar-Joseph团队在《Bioinformatics》发表的研究中,提出了名为Marlene的创新深度学习框架。该方法通过三个关键技术突破实现了动态基因调控网络的精确重建:首先采用基于多头注意力(PMA)的集合变换器(Set Transformer)进行基因特征提取;其次利用GRU动态更新自注意力模块的权重矩阵以捕捉时序依赖;最后引入模型无关元学习(MAML)策略,将不同细胞类型视为独立任务,显著提升对稀有细胞类型的网络推断能力。研究团队将该方法应用于SARS-CoV-2疫苗接种、人类肺衰老图谱和小鼠肺纤维化三个scRNA-seq数据集,证明其相比GENIE3、SCODE等传统方法能识别更多经实验验证的转录因子-基因互作关系。

在技术方法层面,研究主要包含:1)使用TRRUST数据库限定转录因子范围;2)通过Pooling by Multihead Attention(PMA)实现基因特征提取;3)采用GRU演化自注意力投影矩阵构建动态邻接矩阵;4)应用模型无关元学习处理稀有细胞类型;5)基于Fisher精确检验和基因集富集分析(GSEA)评估网络质量。实验数据来源于人类外周血单个核细胞(PBMCs)的SARS-CoV-2 mRNA疫苗接种队列、人类肺细胞图谱(HLCA)和小鼠肺损伤模型。

【SARS-CoV-2疫苗接种响应分析】

研究将Marlene应用于7种免疫细胞的scRNA-seq数据(B细胞、树突细胞等),发现其重建的网络在5种细胞类型中显著优于基线方法。例如在B细胞中识别出800多个RegNetwork数据库验证的调控关系(FDR≤1e-67),较次优方法SCODE多出38%。通过计算连续时间点网络的重叠度(IoU),发现疫苗接种后2天出现最剧烈的网络重构,这与预期免疫激活时程高度吻合。对新出现的调控关系进行基因集富集分析,发现树突细胞中"干扰素γ响应"通路显著富集(FDR=1e-6),该通路已知与抗SARS-CoV-2免疫直接相关。

【肺衰老进程研究】

将人类肺单细胞图谱按年龄分为<35岁、35-50岁和≥50岁三组,Marlene在11种肺细胞类型中展现出优越性能。对经典单核细胞识别出1000多个已验证调控关系(FDR=1e-76),即使细胞数仅138个的稀有非经典单核细胞仍保持高准确度(FDR≤1e-27)。时序分析显示,≥50岁组中4种细胞类型显著富集衰老相关基因(SenMayo set),包括已知的p53通路调控因子,为细胞衰老累积理论提供了分子证据。

【方法学创新验证】

消融实验证实GRU和PMA模块的不可或缺性——去除GRU后网络时序连续性显著降低,替换PMA为DeepSet则使TRRUST数据库重叠下降23%。与传统基因表达重构目标相比,以细胞类型分类为训练目标使调控网络准确性提升31%,表明适当的归纳偏置对生物网络推断至关重要。

这项研究的意义在于:1)首次将动态图神经网络与元学习结合应用于scRNA-seq数据分析,解决了稀有细胞类型网络重建的难题;2)通过GRU演化注意力机制,实现了调控关系连续变化的定量刻画;3)在COVID-19免疫应答、肺纤维化和衰老等重大医学问题上提供了新的机制见解。局限性在于当前版本尚未整合染色质可及性(ATAC-seq)等多组学数据,且对超长时序的处理仍需改进。未来通过引入FlashAttention等优化策略,有望进一步提升模型在全基因组尺度上的应用潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号