哺乳动物同义位点保守性研究:解锁转录奥秘,揭示进化密码

【字体: 时间:2025年02月28日 来源:Nature Communications 14.7

编辑推荐:

  为探究哺乳动物同义位点保守性,瑞典乌普萨拉大学研究人员开展相关研究,发现支持 “有害转录本假说”(UTH)的证据,有助于理解哺乳动物基因组进化。

  在生命科学的探索历程中,哺乳动物基因组一直是研究者们关注的焦点。我们都知道,基因就像生命的 “蓝图”,指导着生物体的生长、发育和各种生命活动。而在哺乳动物的基因世界里,有一个有趣的现象:它们的基因组在第三密码子位置往往偏向于 GC 碱基。这一现象背后的原因是什么呢?科学家们推测,这可能与 GC 偏倚的祖先基因组以及基因转换(gBGC)这一过程有关,gBGC 会使等位基因在减数分裂重组时偏向于 GC 等位基因。但这只是其中一部分原因,还有许多谜团尚未解开。
同时,关于同义位点(即那些不会改变氨基酸序列的位点)的进化,科学界也存在诸多争议。以往,人们认为同义位点的突变是中性的,不会受到自然选择的影响。但随着研究的深入,越来越多的证据表明,在一些物种中,选择确实会作用于同义位点。然而,对于像人类这样生长缓慢、有效种群大小()较低的物种,同义位点上的限制究竟有多普遍,仍然是一个未解之谜。

此外,大量的转录本中只有一小部分编码蛋白质,那么其余的转录本是怎么回事呢?“有害转录本假说”(UTH)认为,这些转录本很多可能是有害的,而高 GC 含量的同义位点或许有助于保护机体免受这些有害转录本的影响,尤其是在较低的物种中。但这一假说是否正确呢?为了揭开这些谜团,来自瑞典乌普萨拉大学(Uppsala University)的 Matthew J. Christmas、Michael X. Dong 等研究人员开展了一项深入的研究。

他们利用 240 种胎盘哺乳动物的基因组比对数据以及单碱基分辨率的保守性评分,全面地对哺乳动物同义位点的保守性进行了研究。最终,这项研究的成果发表在了Nature Communications上。

在研究过程中,研究人员运用了多种关键技术方法。首先,他们使用了 Zoonomia 项目生成的 241 种胎盘哺乳动物基因组的多基因组 Cactus 比对数据,以及基于人类参考基因组(Hg38)的 phyloP 评分,这些数据为研究提供了基础。其次,通过选取代表性转录本,结合自定义的 Perl 脚本和 BEDtools 工具,精确地识别出哺乳动物的四折叠简并位点(4d 位点)。此外,他们还利用 NHLBI Trans - omics for precision medicine(TOPMed)的数据,对人类 4d 位点的遗传变异进行评估;借助 PSMC 方法估计历史,并获取基因组转座元件(TE)含量数据,从而深入分析多个因素与 4d 位点保守性的关系。

下面我们来看看具体的研究结果:

  1. 保守 4d 位点的 GC 偏倚:研究人员通过对大量 4d 位点的分析发现,除了棉鼠(Sigmodon hispidus),几乎所有哺乳动物基因组在 4d 位点都呈现出 GC 偏倚。在保守的 4d 位点中,超过 80% 的碱基为 G 或 C。而且,转录本的 GC4 含量在人类基因组和其他哺乳动物基因组之间存在很强的相关性,这表明相似的过程在塑造哺乳动物同义位点碱基组成方面发挥了作用。同时,他们还发现 4d 位点的保守性与 GC4 含量之间并非完全由 gBGC 决定,这为后续研究提供了新的方向。
  2. 密码子特异性 GC 偏倚:进一步研究发现,不同密码子的 4d 位点存在着明显的 GC 偏倚差异。例如,在脯氨酸密码子中,GC4 含量最低为 59.5%,而缬氨酸密码子中最高可达 90.5%。这种差异反映了密码子使用的限制,像一些会形成 CpG 位点或导致 mRNA 形成 G - 四链体结构的碱基组合,会受到选择的限制。此外,保守的 3d 和 2d 位点在大多数密码子中也表现出很强的 GC 偏倚,这进一步说明了 GC 偏倚在同义位点中的普遍性。
  3. 单外显子基因和第一外显子的高 GC4 含量:根据 UTH,不含内含子的转录本应具有高 GC 含量以被识别为天然转录本。研究人员通过对比单外显子基因和多外显子基因的 4d 位点 GC4 含量,发现单外显子基因的 GC4 含量(中位数为 0.67)显著高于多外显子基因(中位数为 0.57)。而且,多外显子基因的第一外显子 GC4 含量(中位数为 0.72)也明显高于其他外显子,这一结果有力地支持了 UTH 的预测。
  4. 剪接位点的高保守性:UTH 预测参与转录剪接的 4d 位点应受到高限制,以避免错误剪接产生有害转录本。研究数据显示,位于剪接位点附近的 4d 位点的 phyloP 值明显高于其他位点,这表明这些位点受到更强的约束。在保守的 4d 位点,剪接连接处的碱基组成存在强烈偏向,如在哺乳动物中,5和 3外显子边界处的 G 碱基比例分别高达 79.1% 和 93.6%,这对于确保准确的剪接至关重要。
  5. 人类 4d 位点的群体变异:研究人员利用 TOPMed 数据集评估人类 4d 位点的变异水平,发现保守位点的变异比例(20.9%)低于非保守位点(28.3%),且保守位点的次要等位基因频率(MAF)也显著更低(保守位点 MAF = 2.5×10-4,非保守位点 MAF = 6.9×10-4)。这表明保守的 4d 位点受到更强的负选择作用,进一步说明同义位点的保守性与功能密切相关。
  6. 与 4d 位点保守性和 GC 含量相关的基因组因素:研究发现,转录本的 GC4 含量与局部 GC 含量呈正相关,但 4d 位点的保守性与局部 GC 含量呈负相关,这表明 4d 位点的保守性并非单纯由 gBGC 驱动。同时,GC4 含量与基因表达水平呈负相关,这意味着高表达和相关的转录偶联修复不能解释保守 4d 位点的高 GC4 含量。此外,研究人员还发现有效种群大小()、基因组转座元件(TE)含量与 GC4 含量之间存在复杂的关系,在一些物种中,与 GC4 含量呈负相关,而年轻 TE 含量与 GC4 含量呈正相关,这反映了不同因素对同义位点 GC 含量的综合影响。
  7. 保守 4d 位点在基因中的分布:研究人员对保守 4d 位点在基因中的分布进行了分析,发现这些位点在不同基因中的分布并不均匀。许多与发育和转录调控相关的基因富含保守 4d 位点,如 HOX 基因。而且,含有保守 4d CpG 位点的基因也富集在发育和转录调控相关的功能中,这表明这些位点在基因功能调控中起着重要作用。
  8. 4d 位点保守性与 PcG 结合和甲基化的关系:研究发现,4d 位点保守性与 Polycomb group(PcG)蛋白结合以及基因甲基化密切相关。PcG 蛋白结合的基因,如 EZH2、SUZ12 和 RNF2 等,其 4d 位点的保守性显著富集。同时,基因的甲基化状态也与 4d 位点保守性相关,低甲基化的基因类(如 c5 类)中,4d 位点的保守性更高,这进一步揭示了 4d 位点保守性的调控机制。
  9. 保守 4d CpG 位点富集与基因表达的关系:研究表明,富含保守 4d CpG 位点的基因表达水平更高,在更多细胞中表达。这支持了 UTH 的预测,即高度表达的基因可能通过基因内甲基化来抑制有害转录本的产生,从而维持基因表达的准确性和稳定性。
  10. 4d 位点保守性与重叠调控特征的关系:通过一般线性模型分析,研究人员发现 GC 比例是解释 4d 位点保守性变异的最重要变量,其他如距离外显子边界、背景 GC 含量等变量也对 4d 位点保守性有一定影响,但总体而言,重叠调控特征只能解释部分 4d 位点的保守性,这表明 4d 位点保守性的影响因素是复杂多样的。

在讨论部分,研究人员指出,虽然高祖先 GC 含量和 gBGC 模型可以解释哺乳动物中部分 GC4 含量的现象,但仍有一些观察结果无法用 gBGC 很好地解释。例如,4d 位点保守性与转录本 GC4 含量以及局部 GC 含量之间的负相关关系。而他们的研究为 UTH 提供了多条支持性证据,表明同义位点保守性可能与减少有害转录本有关。同时,研究还发现一些发育基因中 4d 位点的高保守性可能与较低的突变率有关,这为理解基因进化和功能调控提供了新的视角。此外,研究中发现的同义位点保守性与衰老之间的潜在关联也为未来研究开辟了有趣的方向。

总的来说,这项研究全面地揭示了哺乳动物同义位点的保守性特征,为我们理解哺乳动物基因组进化提供了重要的线索。研究结果表明,同义位点保守性是由多种非互斥的过程共同作用产生的,包括 gBGC、突变率变异和选择等。这些发现不仅深化了我们对基因组进化机制的认识,还为后续研究基因功能、转录调控以及相关疾病的发生发展奠定了坚实的基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号