单细胞扰动状态异质性建模增强应答表达数量性状位点检测

《Nature Genetics》:Modeling heterogeneity in single-cell perturbation states enhances detection of response eQTLs

【字体: 时间:2025年10月21日 来源:Nature Genetics 29

编辑推荐:

  本研究针对传统应答表达数量性状位点(reQTL)研究将扰动处理简化为离散条件的局限性,开发了能量化单细胞水平扰动应答状态的连续评分模型。通过对甲型流感病毒(IAV)、白色念珠菌(CA)、铜绿假单胞菌(PA)和结核分枝杆菌(MTB)刺激下外周血单核细胞(scRNA-seq)数据分析,发现该模型平均比传统离散模型多检测36.9%的reQTL,其中25%呈现细胞类型特异性效应。这项工作为精准识别疾病相关遗传调控机制提供了新范式。

  
在遗传学研究领域,全基因组关联研究(GWAS)已成功鉴定出大量与复杂疾病相关的遗传位点,然而这些风险变异如何通过调控基因表达影响疾病发生的具体机制仍不明确。表达数量性状位点(eQTL)研究通过建立遗传变异与基因表达水平的关联,为解读GWAS结果提供了重要桥梁。但传统基于群体水平(bulk RNA)的eQTL研究存在明显局限——在稳态条件下鉴定的eQTL与GWAS位点的共定位率不足10%,暗示疾病相关的基因调控可能仅在特定细胞状态或生理条件下显现。
为突破这一瓶颈,科学家提出应答eQTL(reQTL)的概念,即基因表达调控效应会随环境扰动而发生变化的eQTL。传统reQTL研究通常将实验条件简单划分为处理组(P)和未处理组(NP),却忽略了关键问题:体外扰动实验对细胞的影响存在显著异质性,同一处理组内不同细胞对刺激的应答程度可能差异巨大。这种细胞水平的变异在bulk RNA研究中被均质化,导致检测灵敏度受限。
针对这一挑战,Cristian Valencia、Aparna Nathan等研究人员在《Nature Genetics》发表最新研究,开发了能量化单细胞扰动应答状态的创新框架。研究团队的核心思路是:通过单细胞转录组数据构建连续扰动评分,替代传统的二元划分,从而更精确地捕捉细胞异质性对遗传调控的影响。
关键技术方法包括:利用LLDEEP DAG2+项目和Randolph等研究提供的scRNA-seq数据(共299,879个PBMC细胞),通过惩罚逻辑回归模型基于校正后的表达主成分(hPCs)预测每个细胞的连续扰动状态;采用Poisson混合效应模型(PME)分析基因表达与基因型、离散扰动状态及连续扰动评分的交互作用;通过共定位分析(coloc.abf)评估reQTL与疾病GWAS位点的关联性。
量化扰动状态
研究团队首先证明了连续扰动评分能准确反映细胞对刺激的转录应答异质性。在IAV刺激实验中,高扰动评分与ISG15、IFI6、IFIT3等干扰素应答基因的表达呈强正相关(Pearson r≈0.8),且这些基因在Molecular Signatures数据库(MSigDB)的"干扰素-α应答"通路中显著富集(GSEA Padjusted=0.003)。类似地,其他病原体刺激也诱导了特征性的转录应答模式,如CA刺激与STAT1、GBP1/5等基因相关,而MTB刺激则与CXCL1/3/5等趋化因子关联。
检测reQTL
研究人员优先分析了1,892个(IAV)至1,355个(MTB)eQTL,然后通过包含基因型与离散扰动状态交互项(G×Discrete)及基因型与连续扰动评分交互项(G×Score)的2df模型检测reQTL。结果显示,四种扰动条件下分别鉴定出166(IAV)、770(CA)、646(MTB)和594(PA)个显著reQTL(LRT Q<0.05)。与仅考虑离散状态的1df模型相比,2df模型不仅保留了89.6%的1df模型检测结果,还额外发现36.9%的新reQTL。
检测应答eQTL效应的效能比较
为评估模型稳健性,研究团队进行了细胞和供体数量的下采样分析。结果表明,在不同样本量条件下,2df模型始终优于1df模型,且效能随应答异质性增加而提升。与另一种单细胞reQTL方法CellRegMap相比,2df模型具有相似的检测效能,但结果可解释性更强且计算效率显著提高。
研究揭示了多种reQTL动态变化模式。例如,rs11867191对SLFN5的eQTL效应在IAV扰动后显著增强(2df-modelPBMC LRT P=1.15×10-173),而在NP状态下几乎无效应(NP-50p eQTLPBMC=-0.07)。相反,rs1464264对ARL4C的eQTL效应则呈现微妙衰减,这种变化在伪bulk模型中未能检测到(Pseudobulk LMEPBMC LRT P=0.207)。
reQTL识别具有扰动特异性调控的基因
共定位分析显示,reQTL与疾病GWAS位点的共定位率显著高于稳态eQTL。特别值得注意的是,某些reQTL的疾病关联性呈现扰动状态依赖性。以IAV实验中rs11721168对PXK的reQTL为例,其eQTL效应在扰动后减弱,且与系统性红斑狼疮(SLE)GWAS位点的共定位主要发生在NP状态下低扰动评分细胞中(PPH4>0.5)。这表明遗传变异对PXK的调控及SLE风险关联高度依赖于细胞应答状态。
应答eQTL可具有细胞类型特异性效应
细胞类型特异性分析发现约25%的reQTL存在异质性效应(Q<0.10)。典型例子包括:rs10774671对OAS1的reQTL在CD4+ T细胞和B细胞中效应更强,而与严重COVID-19的GWAS位点共定位仅在特定细胞状态下显著。更有趣的是,rs11171739对RPS26的reQTL在单核细胞和B细胞中扰动后增强,在NK细胞中却呈相反趋势,在CD8+ T细胞中无显著效应,体现了细胞类型特异性的复杂调控模式。
本研究通过建立单细胞水平连续扰动评分模型,显著提升了reQTL检测效能,平均比传统方法多发现36.9%的reQTL。研究证实了遗传调控的扰动状态依赖性和细胞类型特异性,为理解疾病相关变异在特定生理病理条件下的作用机制提供了新视角。随着单细胞基因组学数据的不断积累,这种建模细胞水平变异的方法将更深入地揭示背景依赖性遗传效应的全貌。尽管当前研究存在扰动评分跨数据集普适性、线性模型局限性和缺乏多组学验证等限制,但所提出的框架为在类器官、实体组织等更复杂系统中探索遗传调控奠定了基础。整合生物学相关扰动与统计模型创新,将最终推动我们对疾病遗传机制的理解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号