解析人类剪接准确性的奥秘:衰老与疾病背后的关键机制

【字体: 时间:2025年01月28日 来源:Nature Communications

编辑推荐:

  RNA 剪接异常与衰老、疾病密切相关,但此前缺乏全面研究。研究人员利用 RNA 测序数据,对超 14k 样本和 40 个人体部位进行研究。结果发现剪接准确性因内含子、组织等而异,年龄增长与剪接保真度下降有关,AD 患者剪接错误增加。该研究为理解衰老和神经退行性疾病提供依据。

  在生命的微观世界里,基因表达就像一场精密的交响乐演奏,而 RNA 剪接则是其中至关重要的乐章编排者。RNA 剪接是指从信使 RNA(mRNA)前体中切除内含子,并将外显子连接在一起形成成熟 mRNA 的过程。在人类中,约 95% 的多外显子基因会进行可变剪接(Alternative Splicing,AS) ,即不同的外显子组合被剪接进入最终的 mRNA,产生多种由同一基因编码的 RNA 结构。然而,这场编排有时会出现 “失误”,剪接过程中的不准确现象可能在衰老和疾病中扮演重要角色。但一直以来,从内含子水平、跨多种组织和大量人类样本的角度,在年龄、神经退行性变以及重要 RNA 结合蛋白(RBPs)和无义介导的 mRNA 降解(Nonsense - Mediated Decay,NMD)因子表达变化的背景下,对全基因组剪接准确性的评估尚未有研究涉及。为了解开这些谜团,来自英国、美国等多个研究机构的研究人员展开了深入探索,相关研究成果发表在《Nature Communications》上。
研究人员利用基因型 - 组织表达(Genotype - Tissue Expression,GTEx)项目 v8 提供的 RNA 测序数据,对超过 30 万个注释内含子和 300 多万个新剪接事件进行研究和特征描述。他们通过分析多种类型的分裂读取(split reads),包括注释的外显子 - 外显子连接读取、新供体连接和新受体连接,来研究剪接准确性。此外,还结合了 RBP 敲低实验和 CLIP - seq 实验的 RNA 测序数据,探究 RBP 和 NMD 表达在调节剪接噪声和改变其分布中的作用。

研究结果如下:

  1. 新连接的检测与特征:研究发现新供体和受体连接普遍存在,其数量平均是独特注释内含子的 11 倍。而且,超过 98% 的新连接可能是由不准确剪接产生的,并且剪接不准确在受体剪接位点比供体剪接位点更常见。通过对不同 Ensembl 转录组版本的分析以及对新连接与注释连接序列相似性的研究,得出了这一结论。
  2. 剪接不准确的原因:新剪接位点与注释剪接位点的高基序序列相似性解释了剪接不准确的现象。应用 MaxEntScan 算法评估序列相似性,发现多数新 5’和 3’剪接位点基序序列比其配对的注释位点弱,且新连接与注释连接的距离分布也表明剪接准确性存在不对称性。
  3. 对蛋白质翻译的影响:与蛋白质编码转录本相关的新连接在 63.5% 的情况下可能是有害的。分析新连接与注释剪接位点的距离以及其对密码子阅读框的影响,发现多数新连接会导致有害的移码突变,影响下游翻译事件。
  4. 剪接准确性的差异:剪接准确性在不同内含子之间存在差异,并且在批量 RNA 测序数据中可能被低估。通过计算错配剪接比率(Mis - Splicing Ratio,MSR)评估剪接不准确的频率,发现非编码转录本中注释内含子的剪接错误更频繁。
  5. 影响剪接准确性的因素:外显子 - 内含子连接处附近的高序列保真度是维持剪接准确性的必要条件。构建零膨胀泊松回归模型发现,基因水平特征和剪接位点序列属性会影响剪接准确性,如转录本数量、蛋白质编码频率、序列保守性等。此外,RBP 表达变化也会影响剪接准确性,通过对 ENCODE 数据中 RBP 敲低实验的分析,发现多数基因敲低会导致 MSR 增加。
  6. 年龄与剪接准确性的关系:年龄增长与不准确剪接水平增加相关。研究发现 107 个 RBPs 和 5 个 NMD 基因的表达水平随年龄下降,且在多个组织中,60 - 79 岁年龄组的 MSR 值显著高于 20 - 39 岁年龄组。在大脑中,年龄相关的剪接不准确影响神经元功能和蛋白稳态相关基因。
  7. 阿尔茨海默病(AD)与剪接准确性的关系:AD 患者大脑中剪接准确性下降,且影响突触功能相关基因。分析 AD 患者和对照样本的 RNA 测序数据,发现 AD 患者大脑中独特的新 5’和 3’剪接事件及相关读取增加,MSR 值升高,且这些变化影响的基因富集于突触功能。

在讨论部分,研究人员指出,剪接不准确在人类组织中普遍存在,5’剪接位点的识别准确性通常高于 3’剪接位点,这可能反映了两者在分子机制上的差异。剪接错误的产生可能源于基因组序列变异或剪接体对剪接信号的识别不准确等。研究还发现 RBP 表达的变化是转录组范围剪接准确性的重要驱动因素,年龄和疾病相关的 RBP 表达变化可能显著影响 AD 的病理生理过程。然而,该研究也存在一些局限性,如使用批量 RNA 测序数据可能低估对稀有细胞类型的影响,对新连接的注释可能存在偏差,以及难以区分调节的新剪接事件和剪接不准确等。

总的来说,这项研究深入揭示了剪接准确性的特征及其在衰老和神经退行性疾病中的作用,为理解这些疾病的发病机制提供了新的视角,也为未来开发基于 RNA 靶向的治疗方法奠定了基础,有助于推动生命科学和医学领域对衰老和疾病相关机制的研究进展。

该研究主要运用了以下关键技术方法:

  1. RNA 测序数据处理:使用来自 GTEx 项目 v8 的 RNA 测序数据,通过 IntroVerse 数据库进行处理,筛选和注释分裂读取,得到包含注释内含子和新连接的数据集。
  2. 计算分析方法:包括计算新连接的重新分类率、独特新连接和读取计数的百分比、MaxEntScan 评分、基因组距离和 Modulo3 值、MSR 和转录本每百万(Transcript Per Million,TPM)测量等,以评估剪接准确性和相关特征。
  3. 模型构建:构建零膨胀泊松回归模型预测 MSR,分析基因和内含子水平特征对剪接准确性的影响;还构建线性回归模型研究 RBP 表达与年龄的关系。
  4. 实验数据整合:整合 ENCODE 项目中 RBP 敲低实验的 RNA 测序数据和 CLIP - seq 数据,研究 RBP 表达变化对剪接准确性的影响。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号