基于单细胞eQTL数据的细胞状态水平转录组范围关联研究新方法TWiST

《Cell Genomics》:Transcriptome-wide association studies at cell-state level using single-cell eQTL data

【字体: 时间:2025年11月04日 来源:Cell Genomics 9

编辑推荐:

  本研究针对传统转录组范围关联研究(TWAS)无法解析细胞状态异质性的技术瓶颈,开发了TWiST方法。该方法通过伪时间建模连续细胞状态,在单细胞水平捕捉基因表达对复杂性状的动态影响,显著提升统计效能。应用至OneK1K队列发现免疫细胞分化轨迹中数百个基因与自身免疫病存在动态关联,为疾病机制研究提供新视角。

  
随着基因组学研究的深入,科学家们发现许多疾病相关的遗传变异往往通过影响基因表达来发挥作用。转录组范围关联研究(TWAS)作为一种重要的分析工具,能够将基因组层面的发现与基因功能联系起来。然而,传统TWAS方法存在明显局限——它们大多基于混合细胞群体的批量RNA测序数据,无法分辨单个细胞的状态差异。这就好比试图通过观察一杯混合果汁来分辨其中每种水果的成熟度,显然难以精确捕捉每种成分的细微变化。
在真实生物环境中,即使是同类细胞也存在着显著的状态差异。以免疫细胞为例,从初始状态到记忆状态的转变是一个连续过程,不同分化阶段的细胞可能对疾病发展产生截然不同的影响。这种细胞状态的动态变化在自身免疫疾病、神经退行性疾病等复杂疾病中可能发挥着关键作用,但传统研究方法对此却无能为力。
为了突破这一技术瓶颈,来自华盛顿大学的研究团队开发了名为TWiST的创新分析方法。该方法巧妙地将伪时间概念引入单细胞TWAS分析,能够沿着细胞分化轨迹连续追踪基因表达对疾病性状的影响。这项发表于《Cell Genomics》的研究,标志着单细胞基因组学分析迈入了能够解析细胞状态动态变化的新阶段。
研究团队主要采用了以下几项关键技术:首先利用单细胞表达数量性状位点(eQTL)数据,通过功能回归方法建立基因表达预测模型;其次采用伪时间分析技术表征细胞状态连续性;最后通过平滑样条建模构建基因-性状关联的动态曲线。研究数据主要来源于OneK1K队列的981个欧洲裔个体的外周血单核细胞单细胞RNA测序数据。
模拟研究验证方法效能
通过精心设计的模拟实验,研究团队系统评估了TWiST方法的性能。在四种不同情境下(无效、恒定、单峰和反向效应),TWiST均展现出优越的统计特性。
特别是在存在动态效应的情况下,TWiST的检测效能显著优于基于伪聚类的传统方法。当基因表达对性状的影响随伪时间发生变化时,TWiST检测动态关联的效能达到伪聚类方法的两倍以上。这一优势在因果单核苷酸多态性(SNP)数量较多时尤为明显,说明方法能够有效利用遗传信息的丰富性来捕捉复杂模式。
OneK1K数据模型训练
应用至真实数据时,研究团队重点分析了三种主要免疫细胞:CD4+ T细胞、CD8+ T细胞和B细胞。通过Slingshot算法构建细胞分化轨迹,将伪时间量化为0到1的连续变量,其中0代表初始状态,1代表记忆状态。基因表达预测模型的训练显示,虽然细胞水平的预测精度有限,但个体水平的预测效能与传统方法相当。这表明单细胞数据的噪声虽然增加了细胞水平预测的难度,但通过整合多个细胞的信息仍能获得可靠的遗传调控表达估计。
自身免疫疾病关联分析
在实际应用层面,研究团队将TWiST应用于七种自身免疫疾病的GWAS摘要数据,包括类风湿关节炎(RA)、系统性红斑狼疮(SLE)、克罗恩病(CD)、炎症性肠病(IBD)、多发性硬化症(MS)、1型糖尿病(T1DM)和强直性脊柱炎(AS)。分析结果显示,TWiST在几乎所有疾病和细胞类型中都表现出比传统方法更强的信号富集。
特别是在CD4+ T细胞中,发现了145个与RA相关的基因、160个与MS相关的基因以及106个与IBD相关的基因。更重要的是,研究鉴定出大量具有动态关联模式的基因,这些基因的表达对疾病风险的影响随着细胞状态的变化而改变。
基因功能富集分析
对动态关联基因的功能分析揭示了丰富的生物学意义。通过基因本体论(GO)富集分析发现,这些基因显著富集于免疫系统相关通路,如抗原加工提呈、主要组织相容性复合体(MHC)蛋白复合体组装等。不同疾病显示出特异的富集模式,例如MS和RA的动态基因更多涉及免疫细胞活化通路,而CD和IBD的基因则显示出不同的遗传架构。进一步聚类分析将MS相关基因按伪时间动态模式分为六类,每类基因具有独特的富集特征,表明不同的动态模式可能通过 distinct 的生物学机制影响疾病。
方法优势与局限
TWiST的核心优势在于其能够捕捉细胞状态水平的精细变化,这是传统伪聚类方法无法实现的。通过连续建模策略,方法不仅提高了检测效能,还提供了动态和非线性检验等新维度的分析能力。然而,方法也存在一定局限,如计算强度较大、对多谱系分析的适应性有限等。这些限制为未来方法改进指明了方向。
这项研究的重要意义在于将TWAS分析推向了单细胞分辨率的新高度。通过揭示基因表达在细胞状态水平对复杂性状的动态影响,为理解疾病机制提供了前所未有的精细视角。随着单细胞eQTL数据的不断积累,TWiST有望成为探索复杂疾病遗传基础的重要工具,特别是在细胞分化、免疫应答等动态生物学过程中发挥关键作用。该方法的应用将促进从静态的基因-疾病关联向动态的细胞状态-疾病关联的范式转变,最终为精准医疗提供新的生物学见解和治疗靶点。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号