人类种系新生突变率和谱的祖先、遗传及环境影响研究

【字体: 时间:2025年05月16日 来源:Nature Communications 14.7

编辑推荐:

  为探究种系新生突变(DNM)率和谱的影响因素,研究人员分析超万例全基因组测序三人组,发现遗传祖先与 DNM 率和谱相关,吸烟增加 DNM 率,更年期年龄与 DNM 率负相关。研究为解析突变机制提供新视角。

  
种系突变作为生物进化的基础过程,其新生突变(de novo mutation, DNM)不仅是群体等位基因多样性的重要来源,更是导致发育性疾病的关键因素。尽管种系 DNM 发生率极低,但已知其会受到化疗药物、电离辐射等环境诱变剂的影响。然而,遗传祖先、常见遗传变异与环境因素(如吸烟)对 DNM 率和突变谱(mutation spectra,即不同类型突变的分布模式)的直接影响,长期以来因缺乏大规模数据集而难以深入探究。例如,烟草烟雾对 DNM 中最常见的单核苷酸变异(single nucleotide variants, SNVs)的作用尚不明确,不同人群间突变谱差异的驱动因素也存在争议。

为填补这一空白,英国威康桑格研究所(Wellcome Sanger Institute)等机构的研究人员,对来自 “英国基因组学 10 万基因组计划”(Genomics England 100,000 Genomes Project)的10,557 个全基因组测序三人组(包含父母及子女样本)展开分析,聚焦遗传祖先(基于 1000 基因组计划的大陆级分类:非洲 AFR、美洲 AMR、东亚 EAS、欧洲 EUR、南亚 SAS)、父母遗传变异、吸烟行为与 DNM 率及突变谱的关联。该研究成果发表于《Nature Communications》,为理解种系突变的多维度调控机制提供了重要依据。

研究采用的关键技术方法包括:

  1. 全基因组测序与新生突变检测:利用 Platypus 算法从三人组中识别 DNM,包括单核苷酸变异(SNV)和短插入缺失(indels),并通过亲本杂合 SNP 对 DNM 进行亲本相位分析(phasing),确定突变来源。
  2. 遗传祖先推断:基于主成分分析(PCA)和随机森林分类器,将参与者按遗传相似性归类至五大洲祖先群体,并通过严格过滤获得 9,820 个非混杂三人组。
  3. 统计模型构建:运用广义线性模型(GLM)分析祖先、吸烟等因素与 DNM 计数的关联,通过组成型线性回归模型(compositional linear regression)解析突变谱差异,并利用 GREML-LDMS 算法估计单核苷酸多态性(SNP)遗传力。
  4. 孟德尔随机化(Mendelian randomization, MR)分析:借助两样本 MR 评估吸烟、BMI、更年期年龄等因素与 DNM 率的因果关系。

研究结果


1. 遗传祖先对 DNM 率和突变谱的影响


通过广义线性模型控制父母年龄和测序技术参数后,发现非洲祖先群体(AFR)的 DNM 计数显著高于欧洲(EUR)、南亚(SAS)和美洲(AMR)群体(fold change 1.031–1.042, FDR≤5%)。突变谱分析显示,欧洲与南亚群体在 C>A 和 CpG>TpG 替换比例上存在显著差异(FDR≤5%),而非洲与非非洲群体间未观察到突变谱差异。这些差异经多重敏感性分析排除了测序偏差或参考数据库效应的干扰,提示祖先相关的遗传或环境因素可能驱动了 DNM 特征的群体分化。

2. 遗传因素对 DNM 率的贡献有限


在欧洲祖先群体中,基于 GWAS 和 SNP 遗传力分析发现,常见遗传变异(MAF≥0.1%)对 DNM 率的解释度极低,未达到显著水平。尽管已知与自然更年期年龄(age at natural menopause, ANM)相关的遗传变异(涉及 DNA 修复基因)与女性种系 DNM 率呈负相关(MR 验证),但整体而言,常见 SNP 对 DNM 率变异的贡献不足 15%,暗示罕见变异或复杂调控路径可能发挥更重要作用。

3. 吸烟与 DNM 率的关联及环境因素分析


利用电子健康记录(EHR)中的 ICD-10 编码定义 “曾经吸烟” 表型,发现父母吸烟与 DNM 率呈显著正相关:母亲吸烟使 DNM 率增加 3.8%(p=2.5×10?2),父亲吸烟增加 1.9%(p=4.3×10?2)。孟德尔随机化分析未证实吸烟与 DNM 率的因果关系,且未检测到吸烟相关突变特征,提示吸烟可能通过伴随的其他诱变暴露间接影响突变。此外,除更年期年龄外,其他环境因素(如饮酒、BMI)未显示与 DNM 率的一致关联。

结论与讨论


本研究首次通过超万人三人组队列,直接证实了遗传祖先与种系 DNM 率及突变谱的显著关联,揭示吸烟对 DNM 率的潜在促进作用,并确认更年期年龄相关遗传通路对突变率的调控。研究结果表明,群体间突变差异可能反映了历史环境暴露或遗传漂变的长期影响,而吸烟等现代环境因素对种系突变的贡献虽小但具有流行病学意义。

值得注意的是,非洲与非非洲群体在突变谱上的差异与基于多态性数据的既往研究不一致,这可能源于多态性数据反映的是数千代累积的突变,而本研究仅捕获单代突变事件,提示环境或遗传因素的跨代变化可能重塑突变模式。此外,常见遗传变异对 DNM 率的低解释度,暗示需通过更大样本量探究罕见变异或表观遗传机制的作用。

该研究不仅为群体遗传学、突变进化理论提供了实证数据,也对疾病风险预测(如发育性疾病的祖先特异性突变负荷)和环境健康研究(如吸烟的跨代遗传影响)具有重要启示。未来需整合更广泛的祖先群体和环境暴露数据,以全面解析种系突变的复杂调控网络。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号