单细胞 eQTL 图谱剖析自身免疫性疾病基因并揭示新型治疗药物类别

【字体: 时间:2025年03月28日 来源:Cell Genomics 11.1

编辑推荐:

  本文提出联合模型 JOBS,整合 bulk eQTL(bk-eQTL)和单细胞 eQTL(sc-eQTL)数据,显著提升分析效能。借此识别出 14 种自身免疫性疾病的新风险基因,开发药物重利用流程并验证多种潜在药物,为疾病研究和治疗开辟新方向。

  

研究背景

在过去十年间,全基因组关联研究(GWASs)已识别出大量与复杂人类性状和疾病相关的信号,不过多数相关变异的功能影响尚不明确。大多数关联变异位于基因组的非编码区域,通过调节基因表达水平发挥作用,确定其调控的靶基因至关重要,这需要整合表达数量性状位点(eQTL)数据集。然而,尽管有多种分析方法,多数 GWAS 信号仍无法与 eQTL 变异共定位,可能原因包括 eQTL 或 GWAS 研究的效力不足、细胞异质性,以及非编码变异通过其他机制影响疾病结局等。
单细胞 RNA 测序(scRNA-seq)技术的发展,使研究人员能够通过同时分析众多细胞的基因表达水平来表征调控效应的细胞异质性,并识别出特定细胞类型的 eQTL(sc-eQTL)。不过,与批量组织的 eQTL 数据(bk-eQTL)相比,sc-eQTL 数据集规模较小,往往缺乏揭示微妙调控效应的能力。因此,开发创新的计算策略来增强 sc-eQTL 研究的效力,对于加速解析 GWAS 位点的机制至关重要。

JOBS 模型的设计

为提升 sc-eQTL 研究的效力,研究团队开发了 JOBS(将 bk-eQTL 视为 sc-eQTL 加权和的联合模型)方法。理论上证明 bk-eQTL 可由组成细胞类型的 sc-eQTL 加权组合近似。JOBS 仅需 bk-eQTL 和 sc-eQTL 的汇总统计信息(即效应估计值和标准差)作为输入,这些数据在大规模遗传研究中广泛可得。
在估计细胞类型权重时,JOBS 利用非负最小二乘法,最小化 bk-eQTL 效应与 sc-eQTL 效应加权和之间的平方差。研究发现,JOBS 估计的权重与从细胞计数或读数计数估计的平均细胞类型比例密切相关,但概念上并不等同。JOBS 通过联合建模 bk-eQTL 和 sc-eQTL,提供了 sc-eQTL 效应的优化估计,这些估计是最佳线性无偏估计(BLUE),在所有线性估计中具有最小方差。此外,JOBS 还能显著改进包括 sc-eQTL 发现、转录组全关联研究(TWAS)、共定位分析和药物重利用分析等下游分析。

研究结果

  1. JOBS 显著提升识别 eQTL 的能力:将 JOBS 应用于 OneK1K 研究(一项对 982 名个体的 14 种不同细胞类型的调控变异进行分析的 sc-eQTL 研究)和 eQTLGen 数据集(基于对 30,000 多名个体的联合分析得到的 bk-eQTL 数据集)的联合分析。JOBS 估计的细胞类型权重与 OneK1K 研究中的平均细胞类型比例高度相关,如幼稚和中枢记忆 CD4 T(CD4NC)细胞权重为 32.0%,自然杀伤招募细胞(NKR)权重为 0.01% 。
与仅使用 OneK1K 数据相比,JOBS 在识别 eSNPs(即双尾 p 值 < 1×10-5的 SNP)时,对常见细胞类型和罕见细胞类型的功效提升均十分显著。例如,JOBS 为树突状细胞(DCs)识别出 79,767 个显著 eSNPs,比仅使用 OneK1K 数据多 25%;对于 CD4NC细胞,JOBS 识别出的 eSNPs 数量比 OneK1K 数据多 694% 。而且,JOBS 识别出的许多 eQTL 对 OneK1K 和 eQTLGen 数据而言都是全新的。
与其他联合分析多种细胞类型的方法(如 mashr)相比,JOBS 在计算效率和识别 eSNPs、eGenes 的能力上具有明显优势。JOBS 识别出的可复制 eSNPs 和 eGenes 数量更多,且在更大的数据集上验证时优势更为突出。同时,JOBS 改进的 sc-eQTL 发现对 TWAS 和共定位分析等下游分析也有显著益处,能提高基因表达预测准确性和共定位分析的功效。2. TWAS 和共定位分析发现自身免疫性疾病的新位点:对 14 种自身免疫性疾病的 GWAS 数据集进行 TWAS 分析,使用 JOBS 优化的 sc-eQTL 作为输入并结合 EXPRESSO 预测基因表达,与其他方法相比,识别出更多的位点和已知位点,共发现 310 个新位点。
通过聚焦 TWAS 精细定位(后验包含概率 > 95%)和共定位分析(使用 COLOC 的后验概率 > 0.95)确定的靶基因,发现了许多细胞类型特异性基因。这些基因在不同细胞类型中具有异质性效应,可能在批量组织分析中被遗漏。例如,在克罗恩病的研究中,发现干扰素调节因子 3(IRF3)是自然杀伤(NK)细胞中的一个新靶基因;在溃疡性结肠炎(UC)研究中,确定自噬相关 4B 半胱氨酸肽酶(ATG4B)为因果基因;在类风湿关节炎(RA)研究中,发现 DEAD 盒解旋酶 17(DDX17)在 CD4 记忆 T 细胞和幼稚 / 未成熟 B 细胞中具有重要作用;在 1 型糖尿病研究中,识别出蛋白磷酸酶 2 调节亚基 Bγ(PPP2R5C)为 NK 细胞中的因果基因。3. 优化 scRNA-seq 设计提升 sc-eQTL 定位效力:增加测序深度可提高 eQTL 检测的效力,但 JOBS 对常见细胞类型的效力提升更为显著,对罕见细胞类型的提升相对较小。为此提出一种新的 scRNA-seq 策略,即对部分个体的所有细胞类型进行测序,对其余个体进行罕见细胞类型富集和测序。
通过模拟和实际数据分析发现,这种策略可提高罕见细胞类型的测序深度,从而提升 sc-eQTL 定位的效力。例如,将测序深度提高 1.5 倍、5 倍和 10 倍时,sc-eQTL 定位的效力可分别提高 22.7%、77.5% 和 86.3% 。在设计最优的 scRNA-seq 研究时,需在提高罕见细胞类型效力的同时,确保常见细胞类型的效力维持在一定阈值之上。使用 JOBS 分析数据时,可减少对所有细胞类型测序的个体比例,同时增加对罕见细胞类型测序的样本量,在不增加成本的情况下,将罕见细胞类型的效力提高 8 倍。4. 药物重利用分析识别潜在治疗药物:开发了基于 JOBS 结果和双聚类的药物重利用(DR)流程 DR-JOBS。该流程利用药物 × 疾病细胞类型对的双聚类,识别在疾病相关细胞类型中对疾病基因表达有相似影响的药物。已知对炎症和自身免疫性疾病有效的药物(如非甾体抗炎药(NSAIDs)和甾体药物)往往聚集在一起,证明了 DR-JOBS 的有效性。
DR-JOBS 还识别出多种具有潜在治疗应用的新药物。例如,东莨菪碱(hyoscyamine)作为一种毒蕈碱型乙酰胆碱受体抑制剂,与糖皮质激素聚类在一起,可能是治疗 RA 和 UC 的潜在替代药物;色甘酸(cromoglicic acid)对银屑病和 RA 可能有治疗效果;间苯二酚(resorcinol)可能作为治疗皮肤疾病的类固醇节省剂;托法替尼(tofacitinib)对强直性脊柱炎(AS)有治疗潜力;米托蒽醌(mitoxantrone)对 UC 可能有免疫抑制治疗作用。此外,DR-JOBS 还发现了 NSAIDs 在不同自身免疫性疾病中的新用途。5. 药物验证:采用三种正交策略对 DR-JOBS 识别的药物进行验证,包括使用电子健康记录(EHR)数据检查药物对自身免疫性疾病患者炎症标志物的影响、利用富集分析评估药物靶途径是否富含 TWAS 命中基因,以及使用孟德尔随机化方法评估药物靶基因的蛋白质丰度或表达水平对疾病风险的因果影响。
通过 EHR 数据评估发现,许多药物能改善炎症标志物水平,支持其作为候选药物的潜力。例如,双氯芬酸(diclofenac)在治疗银屑病关节炎时,可使 ESR 降低 4%,白蛋白增加 0.9%;东莨菪碱在 RA 患者中,可使 MPV 增加 1.59%,血小板增加 0.0001% 。药物靶途径富集分析和孟德尔随机化分析也为药物的作用机制提供了支持。

讨论

JOBS 方法通过联合分析 bk-eQTL 和 sc-eQTL 数据,有效提升了 sc-eQTL 分析的效力,改进了下游分析,有助于解释 eQTL 和 GWAS 数据集重叠有限的问题。该方法具有广泛的适用性,可应用于其他细胞类型和组织,即使未来 sc-eQTL 样本量增加,JOBS 仍将发挥重要作用。
研究还存在一些需要改进的地方。JOBS 目前未利用细胞类型之间的共享效应,未来可对此进行扩展以进一步提升效力;研究主要基于欧洲血统的数据集,未来在整合非欧洲血统的 sc-eQTL 和 bk-eQTL 数据时,可能需要开发新的方法;在提出的新测序设计中,未考虑测序、细胞分选和富集的成本,纳入成本分析将使 scRNA-seq 设计更具参考价值。
总之,JOBS 是一种简单有效的提高 sc-eQTL 分析效力的方法,通过该方法识别出了自身免疫性疾病的新风险基因和潜在治疗药物,随着研究的不断深入,JOBS 及其相关工具将在阐明疾病病因方面发挥关键作用。

研究局限性

由于数据集的限制,本研究未探讨 JOBS 在非欧洲数据集上的性能,也未研究 JOBS 对疾病样本 eQTL 数据集的适用性。随着未来 sc-eQTL 研究的不断拓展,JOBS 有望进一步优化,以适应不同血统和疾病条件下的遗传效应异质性研究。

资源可用性

本研究的 JOBS sc-eQTL 图谱汇总统计信息和 TWAS 结果可从https://liugroupstatgen.shinyapps.io/JOBS-ATLAS/获取,JOBS 方法的软件可在https://github.com/LidaWangPSU/JOBShttps://zenodo.org/records/14895029获取。如需进一步信息或资源,可联系主要联系人 Dajiang Liu(dajiang.liu@psu.edu)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号