综述:多组学方法在理解非传染性疾病基因 - 环境相互作用中的应用:技术、转化及公平性问题

【字体: 时间:2025年02月10日 来源:Human Genomics 3.8

编辑推荐:

  这篇综述聚焦非传染性疾病(NCDs),探讨多组学技术解析基因 - 环境(GxE)相互作用的应用。阐述了各组学技术的进展与局限、数据整合方法,分析面临的挑战与机遇,强调多组学研究对推进精准医学、改善健康公平性的重要意义,值得一读。

  

非传染性疾病现状与多组学研究意义

非传染性疾病(NCDs),像心血管疾病、癌症、慢性呼吸道疾病、糖尿病以及精神健康障碍等,已然成为全球健康的重大挑战。每年,NCDs 导致 4100 万人死亡,在全球残疾调整生命年(DALYs)中占比 60%,在残疾生命年(YLDs)中占比 81%,占全球总死亡人数的 74% 。从经济层面看,2010 - 2030 年 NCDs 的全球累计负担预计超 47 万亿美元,相当于 2010 年全球 GDP 的 75% 。NCDs 在低收入和中等收入国家造成的影响尤为严重,全球超四分之三的 NCD 相关死亡发生于此。
NCDs 的发生源于遗传与环境因素的复杂相互作用,如缺乏身体活动、不健康饮食、肥胖、吸烟或饮酒等。虽然多数 NCDs 在成年期显现,但根源常可追溯至儿童和青少年时期的行为与生活条件。家族和群体研究表明,NCDs 具有显著遗传成分,例如冠状动脉疾病(CAD)的遗传度约为 50%,自闭症谱系障碍(ASD)约为 80% 。然而,由于 “缺失遗传度问题” 等挑战,人们对 NCDs 的遗传病因理解尚不完整。基因 - 环境(GxE)相互作用可能是解释缺失遗传度的关键因素。
为深入理解 NCDs 的生物学基础,多组学研究至关重要。它整合基因组、表观基因组、转录组、蛋白质组、代谢组、脂质组、微生物组等分子信息以及环境暴露信息(暴露组),有助于揭示疾病机制,推动精准医学发展,实现靶向预防、精确诊断、个性化治疗和准确预后。

组学技术在解析 NCDs 中 GxE 相互作用的应用

研究表明,个体遗传组成、环境暴露及其相互作用影响 NCDs 的发病风险和治疗效果。例如,某些遗传变异会改变接触有机磷农药个体患帕金森病的风险;FTO 基因对体重指数(BMI)的影响会因生活方式因素而变化。
基因组学通过对遗传变异的广泛分析,增进了人们对 NCDs 的理解。全基因组关联研究(GWAS)已鉴定出众多与 NCDs 相关的遗传变异,多基因评分(PGSs)也用于预测疾病风险。不过,GWAS 存在局限性,如研究结果在不同遗传背景人群中的可转移性差,非洲等人群在研究中的代表性不足。此外,标准群体 GWAS 还受群体分层和选型交配的影响。
转录组学借助 RNA 测序(RNA - seq)技术,在揭示 NCDs 病理生理关键细胞通路方面发挥重要作用。通过分析 RNA 转录本,能深入了解基因表达调控和变异。如研究人类主动脉内皮细胞对氧化磷脂的反应,发现约三分之一的高度调控转录本存在 GxE 相互作用。同时,多个转录组学数据资源库为研究提供了丰富资源。
表观基因组学研究 DNA 甲基化和组蛋白修饰等表观遗传修饰,在理解环境因素与遗传易感性相互作用方面意义重大。这些修饰调控基因表达,且对环境暴露和生活方式因素敏感。例如,慢性砷和铅暴露与 DNA 甲基化变化相关,会增加患癌风险;产前饮食因素可改变胎儿表观基因组,影响其日后疾病易感性。先进测序技术和大型合作项目推动了表观基因组学研究进展。
蛋白质组学探索生物体产生或修饰的所有蛋白质,为 NCDs 研究提供关键见解。蛋白质组动态变化,其修饰异常与多种 NCDs 相关。英国生物银行药物蛋白质组学项目(UKB - PPP)通过整合多组学数据,揭示了蛋白质水平差异对疾病研究的重要性,但蛋白质组学在规模化、成本和分析复杂性方面面临挑战。
代谢组学聚焦于小分子代谢物,可直接反映驱动 NCDs 的生化途径。它能量化内源性代谢物和外源性物质,揭示环境暴露的生物学影响。例如,研究职业性三氯乙烯(TCE)暴露,发现其代谢物与内源性代谢物变化相关,体现了 TCE 的毒性。代谢组学在代谢物鉴定和测量方面取得进展,但仍面临挑战。
暴露组学研究环境因素对人类健康的综合影响,考虑多种暴露因素及其与遗传易感性的相互作用。虽然该领域处于早期阶段,但新技术和大规模研究项目为深入理解 NCDs 的 GxE 相互作用提供了机遇。
电子健康记录(EHRs)包含患者丰富的医疗信息,纵向数据有助于研究遗传因素对药物疗效的影响。随着技术发展,EHRs 与个人健康记录(PHRs)融合,在精准医学中发挥重要作用,但数据异质性、质量和管理问题有待解决。

多组学整合技术进展

多组学整合技术的发展有助于深入理解 NCDs 的 GxE 相互作用。其整合方法主要分为两类:GWAS 后分析和基于机器学习的方法。
GWAS 后多组学整合方法中,富集分析方法通过整合 GWAS 数据和其他组学数据,识别与分子特征相关的数量性状位点(QTLs),但存在偏倚问题。统计精细定位方法,如共定位分析和孟德尔随机化(MR),有助于确定因果变异,但 MR 的假设难以验证。多祖先精细定位策略提高了因果基因识别的准确性。插补方法利用参考面板在 GWAS 数据集中插补分子特征,常与其他方法结合,以深入了解 NCDs 发病机制。
基于机器学习(ML)的方法在多组学数据整合中应用广泛,包括早期整合、混合整合、中间整合、晚期整合和分层整合等策略。这些方法在诊断分类、临床结局风险预测、治疗反应预测和 GxE 相互作用估计等方面发挥重要作用,但存在偏差、可解释性和隐私保护等挑战。

多组学研究面临的挑战与机遇

目前,组学和多组学数据集的多样性不足,多数 GWAS 研究以欧洲遗传背景个体为主,非欧洲人群代表性严重不足。这导致 PGSs 在非欧洲人群中的预测准确性降低,限制了研究成果的普适性,加剧了健康不平等。增加数据集的遗传多样性,不仅能减少健康差距,还能提高 GWAS 信号定位精度,发现更多临床相关遗传变异。
测量暴露组面临诸多挑战,环境暴露复杂多样,测量技术虽有进展,但数据标准化和整合困难。建立和维护生物样本库在低收入和中等收入国家面临资金、技术和专业人才短缺等问题,还需解决伦理、法律和社会问题。
多组学数据整合面临数据格式多样、预处理要求高、维数灾难、组织和细胞类型异质性、隐私担忧和数据共享障碍等挑战。验证 GxE 相互作用并将其转化为实际应用也存在困难,模型生物研究结果向人类的转化存在局限性,临床应用面临成本高、技术复杂和缺乏标准化协议等问题。

总结与展望

NCDs 是由基因和环境因素复杂相互作用导致的。多组学方法对揭示 NCDs 的 GxE 相互作用、理解疾病机制和推进精准医学至关重要。然而,多组学研究在实际应用中面临诸多挑战,如数据集多样性不足、暴露组测量困难、数据整合复杂和 GxE 相互作用验证困难等。
未来研究应致力于增加组学和多组学数据集的多样性,开发公平的基因组医学和先进的计算方法,以提高研究的科学性和公平性,减少健康差距。同时,需要各方共同努力,解决数据共享、技术标准和伦理等问题,推动多组学研究在 NCDs 预防、诊断和治疗中的应用,为全球健康事业做出贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号