Multi-INTACT:多组学整合解析复杂性状因果机制,开启精准医学新征程

【字体: 时间:2025年02月10日 来源:Genome Biology 10.1

编辑推荐:

  在基因组关联研究(GWAS)难以明确复杂疾病和性状的致病基因及治疗靶点的背景下,研究人员开展了 Multi-INTACT 算法研究。该算法整合多种 “基因产物” 数据,能更精准识别因果基因。这为复杂疾病研究和药物靶点发现提供了有力工具1210

  在生命科学研究领域,随着全基因组关联研究(GWAS)的广泛开展,人们发现了众多与复杂疾病和性状相关的遗传变异。然而,大部分关联变异位于非编码基因组区域,使得确定其靶基因变得极为困难,也给治疗靶点的识别带来了重重阻碍。以往的研究方法,如转录组全关联研究(TWAS)和共定位分析,虽在一定程度上有所帮助,但都存在各自的局限性,无法准确地识别因果基因。为了突破这些困境,来自美国密歇根大学(University of Michigan)等多个研究机构的研究人员展开了深入研究,相关成果发表在《Genome Biology》上。
研究人员开发了一种名为 Multi-INTACT(多转录组全关联研究和共定位整合分析)的算法,该算法通过整合 GWAS 和多种类型的分子数量性状基因座(QTL)数据,旨在更准确地推断因果基因和相关基因产物。

研究中用到的主要关键技术方法包括:利用结构方程模型(SEM)构建 Multi-INTACT 模型,以描述基因、基因产物、复杂性状和潜在混杂因素之间的关系;通过模拟研究评估 Multi-INTACT 的性能,模拟数据基于 GTEx 的遗传数据生成;在实际数据分析中,整合英国生物样本库(UK Biobank)的蛋白质 QTL 数据和多组织 GTEx 的表达 QTL 数据,对 1408 种代谢物的 GWAS 数据进行分析111213

下面来看具体的研究结果:

  • 方法概述:Multi-INTACT 将传统的单暴露工具变量分析 / TWAS 方法扩展为考虑多个内源性变量,通过整合共定位证据来推断基因与性状之间的潜在因果关系。该方法基于经验贝叶斯程序计算基因的因果概率,并通过模型选择问题确定相关的基因产物34
  • 模拟研究:通过大量模拟研究发现,Multi-INTACT 在识别因果基因方面表现出色,比现有的基于单一基因产物的方法具有更高的功效,同时能有效控制一类错误。在不同的 TWAS 预测模型下,其功效和错误发现率(FDR)结果相当一致56
  • 分析 METSIM Metabolon 代谢物 GWAS 数据:应用 Multi-INTACT 分析 METSIM 研究中的血浆代谢物 GWAS 数据,发现其识别出的因果基因 - 组织 - 代谢物三元组数量明显多于仅基于表达或蛋白质的 INTACT 分析。与基于知识的方法(KBA)对比,Multi-INTACT 与已知注释的 KBA 对的重叠率更高,展现出更强的识别能力。在基因产物与性状效应的方向一致性分析中,发现部分代谢关键组织(如肝脏)的一致性较高。此外,利用 Multi-INTACT 结果进行基因集富集分析(GSEA),识别出了多个与肝脏代谢相关的显著富集的生物学过程(BP)GO 术语789

研究结论和讨论部分表明,Multi-INTACT 在推断因果基因和机制方面具有重要意义。它通过整合多种基因产物的数据,有效提高了因果基因识别的统计功效,同时能评估哪些分子基因产物与疾病最为相关,为药物靶点的发现提供了潜在的方向。不过,该方法也存在一定的局限性,如受现有共定位和 TWAS/PWAS 分析方法的输入以及遗传数据质量的影响。未来,研究人员将探索结合其他策略进一步提高因果基因推断的能力,同时考虑纳入更多的基因组信息,如染色质结构、甲基化状态等,以完善该方法。Multi-INTACT 为复杂性状病因学研究提供了强大的工具,随着分子 QTL 数据集的不断丰富,其应用前景将更为广阔。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号