TWAS Atlas 2.0:转录组水平关联研究数据资源全面升级,助力基因-性状因果机制深度解析

《Nucleic Acids Research》:TWAS atlas 2.0: an updated data resource for transcriptome-wide association studies

【字体: 时间:2025年11月19日 来源:Nucleic Acids Research 13.1

编辑推荐:

  为解决转录组水平关联研究(TWAS)数据分散、分析工具不足的问题,研究人员开发了TWAS Atlas 2.0平台。该研究整合424篇文献与171个GWAS数据集,新增27万基因-性状关联,涵盖590种性状和2.4万个基因。平台创新性融合知识图谱、多组织TWAS分析及四大功能模块(富集分析、SMR、共定位、精细定位),显著提升基因因果推断能力。该资源为复杂性状遗传机制研究提供一站式解决方案,发表于《Nucleic Acids Research》数据库专刊。

  
随着基因组学研究的深入,转录组水平关联研究(TWAS)已成为连接基因组变异与复杂性状的关键桥梁。通过整合大规模全基因组关联研究(GWAS)和表达数量性状位点(eQTL)数据,TWAS能够预测基因表达水平并识别与疾病相关的候选基因。然而,TWAS研究结果的分散性、缺乏统一标准化分析工具以及难以进行因果推断等问题,严重限制了其广泛应用。为此,中国科学院北京基因组研究所等单位联合发布了TWAS Atlas 2.0,这一全面升级的数据资源为研究人员提供了集成化分析平台,显著提升了对基因调控机制的理解能力。
关键技术方法概述
研究团队通过多维度数据整合与算法创新构建TWAS Atlas 2.0。首先系统检索PubMed中TWAS相关文献(截至2025年4月),人工筛选424篇高质量研究提取基因-性状关联数据。同时收集171个欧洲人群GWAS摘要统计数据(含UK Biobank和GWAS Catalog来源),使用S-PrediXcan进行组织特异性分析、S-MultiXcan进行跨组织分析,显著扩展表型覆盖范围。此外,利用DeepSeekR1模型从文献中智能提取基因-性状关联描述语句,构建增强型知识图谱。平台还整合四大分析模块:ClusterProfiler进行GO/KEGG富集分析;SMR(Summary-data-based Mendelian Randomization)验证基因因果效应;coloc包进行共定位分析;FOCUS实现精细定位。所有数据均标准化至GRCh38参考基因组,确保分析一致性。
显著增加的基因-性状关联数量
TWAS Atlas 2.0较第一版实现数据量质的飞跃。通过文献 curation 新增224篇TWAS研究,并结合自主分析的171个GWAS数据集,将基因-性状关联从401,226条提升至676,198条,增幅达69%。新增333种表型类型,使总表型数达590种,覆盖24,870个基因和187种组织。值得注意的是,阿尔茨海默病和精神病成为研究最集中的领域,分别有36篇和35篇相关文献。新增表型包括晚期基底细胞癌、神经性厌食症等难治性疾病,极大丰富了数据库的疾病谱。
多模块互补分析能力
平台突破性集成四大分析模块,形成多维因果推断体系。功能富集分析显示312种表型存在显著GO功能富集,128种表型具有KEGG通路富集信号。以2型糖尿病为例,其TWAS关联基因显著富集于碳水化合物响应、蛋白质定位负调控等代谢相关通路。SMR模块从171个GWAS数据集中识别出1974个候选基因,共定位模块发现40个共享因果变异基因,精细定位模块确定467个90%可信集基因。三大模块共同验证了ATP13A1、TM6SF2等11个基因在非酒精性脂肪肝病(NAFLD)中的多维度证据,显著提升因果基因推断可靠性。
用户体验与可视化功能升级
在交互设计方面,TWAS Atlas 2.0新增数据集标识系统(TWASD系列ID),支持多实体快速检索。每个表型页面引入交互式曼哈顿图,支持按组织、染色体和方法筛选数据,点大小表示效应值,垂直位置显示统计学显著性。知识图谱模块创新性推出双表型重叠基因可视化功能,例如通过比较NAFLD与结直肠癌,发现RNF5、ERLIN1等共享基因,提示代谢紊乱与肿瘤发展的共同遗传机制。
案例研究:非酒精性脂肪肝病的多维度解析
以NAFLD为例展示平台的分析能力。曼哈顿图显示染色体6、19和22存在显著关联信号,除已知风险基因PNPLA3、SAMM50外,新发现C4A和ATP13A1等候选基因。富集分析揭示这些基因显著富集于抗原呈递、MHC II类蛋白复合体组装等免疫相关通路,与HLA家族基因的强关联性相符。四大分析模块共同验证了11个基因的多维度证据,其中HSD17B13通过精细定位确认其与肝纤维化进展的关联,为临床干预提供新靶点。
结论与展望
TWAS Atlas 2.0通过系统性文献curation、多组学数据整合和先进算法融合,建成目前最全面的TWAS知识库。其创新性体现在三个方面:数据量级跃升(新增27万关联)、分析维度拓展(四大因果推断模块)、可视化交互增强(知识图谱与曼哈顿图联动)。与TWAS Hub、WebTWAS等平台相比,该资源更注重证据curation与生物学机制挖掘。未来计划整合KEGG、Reactome等通路数据,引入scPrediXcan等AI驱动的新型TWAS方法。作为国家基因组数据中心(NGDC)核心资源,该平台将持续更新,为复杂疾病遗传机制研究提供强大支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号