田纳西州生物样本库与整合基因组学计划揭示儿童群体遗传多样性对精准医学的启示

【字体: 时间:2025年05月23日 来源:Nature Communications 14.7

编辑推荐:

  为解决基因组研究中欧洲人群数据主导导致的健康不平等问题,田纳西州生物样本库与整合基因组学计划(BIG)团队通过分析13,152例外显子组数据,构建了涵盖非欧裔和混合 ancestry(遗传祖先)的 Mid-South 人群资源。研究发现:50%参与者携带非欧或混合 ancestry,其中20%具有高非洲 ancestry 多样性;混合 ancestry 个体中 novel variants(新变异)富集功能位点;哮喘和肥胖在 urban(城市)少数族裔中 odds ratio(OR值)显著升高。该研究为 ancestry-informed( ancestry 导向的)精准医疗提供了模型,成果发表于《Nature Communications》。

  

研究背景与意义
人类基因组研究长期存在"欧洲中心主义"偏差,约80%的遗传数据来自欧洲后裔,导致非欧人群的疾病风险预测和药物代谢评估(如CYP2C19基因变异)准确性不足。这种代表性失衡加剧了全球健康不平等,尤其在非洲 ancestry 占比最高的美国孟菲斯等地区,其独特的遗传多样性尚未被充分探索。田纳西州生物样本库与整合基因组学计划(BIG)应运而生,旨在通过整合基因组、表型和环境数据,构建涵盖 underrepresented( underrepresented)群体的资源库。

研究设计与方法
由 Silvia Buonaiuto、Franco Marsico 等领衔的多机构团队分析了13,152例外显子组数据,结合电子健康记录(EHR)和地理信息。关键技术包括:1)基于RFMix v.2.0的 global/local ancestry inference( ancestry 推断),阈值设为85%定义 discrete ancestry categories(离散 ancestry 类别);2)使用ShapeIT v5进行phasing(单倍型分型);3)通过hap-ibd检测 identical-by-descent(IBD)片段;4)基于PheCode的疾病表型关联分析;5)建立孟菲斯基因组教育网络(MEMGEN)推动社区参与。样本来自Le Bonheur儿童医院等5个采集点,涵盖87%儿科患者。

主要研究结果

A robust foundation for inclusive genomics studies
队列中87%为<18岁个体,平均年龄8.4岁,42,000名参与者覆盖孟菲斯(高非洲 ancestry 多样性)和阿巴拉契亚 rural( rural)地区。通过MEMGEN项目与7所高中合作,建立社区咨询委员会确保研究符合当地需求。

Capturing broad diversity and several types of admixture
ancestry 分析显示50%为非欧或混合 ancestry(20%非洲相似,30%混合),其中EUR-AFR(欧非混合)群体最多。地理分布显示非洲 ancestry 在 urban 区域集中(dissimilarity index=0.67),而欧洲 ancestry 主导 suburban( suburban)地区。Zip code 分析揭示 ancestry 与环境因素的共分布特征。

Integrating genetic, phenotypic, and environmental information
哮喘(697例)和肥胖在非白人族裔中OR值显著增高(p<0.001),三个 suburban 区域 asthma prevalence(患病率)达整体1.7倍。EUR-AFR群体在四种慢性病中贡献最多病例,凸显遗传-环境交互作用。

Ancestry-specific diversity and genetic burden
发现771,717个 novel variants(占总数11.2%),其中2.8%为 high impact(如 frameshift 变异)。非洲 ancestry 个体平均多85k变异位点,但 deleterious-to-synonymous ratio(有害/同义变异比)最低;EUR-AMR(欧美混合)群体该比值最高,AMR片段中 rare deleterious variants(罕见有害变异)显著多于EUR片段(p=2.2e-16)。

Discrepancies between self-reported race and inferred genetic ancestry
自报种族与遗传 ancestry 不符率达17%,如自报"白人"者实际携带非洲 ancestry。IBD分析发现 second-degree relatives(二级亲属)可能自报不同种族,证实 race(种族)作为生物医学变量的局限性。

结论与展望
BIG研究通过 ancestry 分层揭示了:1)混合 ancestry 个体是 novel variants 的重要来源;2)环境因素与 ancestry 交互影响慢性病风险;3)种族自报不可靠性警示研究设计需谨慎。该模型通过社区参与(如MEMGEN)提升信任度,未来将扩展至10万样本并采用 pangenome(泛基因组)策略。成果为 ancestry-aware( ancestry 认知的)精准医疗奠定基础,尤其对解决孟菲斯等 health disparities(健康差异)显著地区具有示范意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号