
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多组织基因-组织配对因果推断新方法TGVIS:控制微效效应提升心血管代谢性状基因定位精度
【字体: 大 中 小 】 时间:2025年07月03日 来源:Nature Communications 14.7
编辑推荐:
本研究针对传统转录组关联分析(TWAS)方法在存在广泛微效效应(polygenicity)时性能下降的问题,开发了多变量TWAS方法TGVIS。通过整合31种组织的表达/剪接数量性状位点(eQTL/sQTL)与45种心血管代谢性状GWAS数据,该方法在控制微效效应同时精准识别组织特异性因果基因和直接因果变异,仿真显示其真阴性率(0.614)显著优于现有方法,新发现34.3%未被传统TWAS检测的基因-组织对,为复杂性状遗传机制解析提供新工具。
心血管代谢疾病的遗传机制解析长期面临重大挑战。尽管全基因组关联研究(GWAS)已鉴定数千个风险位点,但绝大多数位于非编码区,且存在复杂的跨组织调控网络。传统转录组关联分析(TWAS)虽能关联基因表达与性状,但在存在广泛微效效应(polygenicity)时易产生假阳性,且难以区分共享调控变异的基因。更棘手的是,不同组织间基因共调控现象普遍,约37%的GTEx数据涉及剪接数量性状位点(sQTL),而现有方法如cTWAS和TGFM未能充分建模这些复杂效应。
针对这些瓶颈,研究人员开发了组织-基因对、直接因果变异和微效效应选择器(TGVIS)。该方法创新性地将微效效应建模为随机效应,通过限制性最大似然法(REML)估计,同时采用普拉特指数(Pratt index)量化变量贡献度。在45种心血管代谢性状和31种组织数据验证中,TGVIS展现出三大突破:首先,在仿真中真阴性率(0.614)比TGFM提高19.7%,且平均平方误差降低32%;其次,识别出34.3%未被S-PrediXcan检测的新基因-组织对,如SCN2A-Nerve_Tibial与17种代谢性状的关联;更重要的是,直接因果变异与基因介导变异在FathmmXF评分(P<2.2E-16)等功能注释上呈现显著差异,提示不同生物学机制。
关键技术包括:1)基于Sum of Single Effects(SuSiE)的精细定位框架;2)整合28种GTEx组织及肾脏、胰岛等特殊组织的eQTL/sQTL数据;3)采用UK Biobank 9620个样本构建LD参考面板;4)通过K-means聚类确定普拉特指数阈值(CS-Pratt>0.15)优化变量选择。
主要结果
仿真验证优势:在存在微效效应时,TGVIS的因果效应估计均方误差(MSE)较cTWAS降低32%,真阳性率保持0.667的同时,真阴性率(0.614)显著优于TGFM(0.513)。直接因果变异检测数更接近真实值(平均2.86 vs TGFM的3.58)。
心血管代谢性状解析:在PCSK9基因座,TGVIS精准识别PCSK9-Whole_Blood(CS-Pratt=0.17)和rs11591147变异;而HMGCR位点分析中,TGFM错误筛选POLK-Lung,但TGVIS通过9基因-组织对的可信集捕获到关键降脂靶点HMGCR。
功能与临床价值:22.4%的基因-组织对呈现多效性,如PHACTR1在冠状动脉和主动脉组织均被检出。与FDA批准药物靶点基因的富集分析显示,TGVIS识别基因的富集程度是TGFM的1.43倍(P=1.56E-3)。
这项发表于《Nature Communications》的研究革新了多组织TWAS分析范式。通过建模微效效应和引入普拉特指数,TGVIS不仅解决传统方法假阳性率高的问题,更揭示出组织特异性调控网络的复杂性。特别值得注意的是,肝脏组织虽样本量较小(n=113-588),仍被确认为LDL-C的主要相关组织,印证了方法对异质性数据的稳健性。未来整合单细胞测序和蛋白质组数据,有望进一步揭示基因表达与蛋白质水平的调控分歧,为精准医学提供新见解。
生物通微信公众号
知名企业招聘