真核生物剪接位点选择的基本框架:基于跨物种GWAS与六聚体排序的保守机制解析

【字体: 时间:2025年09月30日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对真核生物剪接位点选择机制不清的问题,通过开发SpliSER量化剪接位点使用强度,对拟南芥、果蝇和人类开展逾13万次GWAS分析。结果表明剪接变异主要受cis调控,首次提出GT[N]4/[N]4AG六聚体排序可作为解释跨物种剪接选择的核心规则,为理解遗传变异影响RNA剪接提供了重要框架。

  
在真核生物中,RNA剪接是基因表达调控的关键环节,其异常会导致从植物开花时间变化到人类遗传疾病等多种表型变异。虽然已知遗传变异和环境因素可通过影响剪接位点强度(splice-site strength)介导剪接变化,但如何准确量化剪接位点使用效率并解析其调控机制仍面临重大挑战。现有研究多局限于局部区域分析或采用人工预测模型,缺乏对剪接位点使用情况的实证量化,且跨物种比较的剪接选择规则尚未明确。这些空白限制了我们对剪接调控进化保守性和疾病机制的理解。
为系统解决这些问题,由Monash大学Sureshkumar Balasubramanian领衔的国际团队在《Nature Communications》发表了突破性研究。团队开发了剪接位点强度估计(Splice-site Strength Estimate, SSE)量化方法,基于1001拟南芥基因组计划、果蝇遗传参考面板(DGRP)和GTEx项目的人类心脏组织RNA-seq数据,对767,199个剪接位点进行实证量化。通过创新性开展130,650次剪接位点全基因组关联分析(SpliSER-GWAS),绘制出三种物种剪接变异的遗传图谱。
研究采用多重技术方法:基于RNA-seq数据使用TopHat2(拟南芥)和STAR(果蝇/人类)进行序列比对;通过Regtools提取剪接连接点;利用SpliSER v0.1.8.9计算剪接位点使用强度;运用GEMMA v0.98.3进行GWAS分析;采用合成基因构建和HEK293T细胞转染实验验证功能;通过自定义Python脚本进行六聚体排序分析。
Extensive variation in splice-site usage
研究发现56.1%的剪接位点在个体间使用差异超过20%,且超过25%的位点显示高遗传力(拟南芥>0.3,果蝇更高),表明剪接变异具有高度可遗传性。
SpliSER-GWAS is specific and captures causal variants
在203个已知剪接位点突变中,59%(拟南芥)和60%(人类)的最高关联SNP直接定位到因果变异。如在人类TOR1AIP1基因中,chr1:179,889,309的G→A突变被同时映射为原剪接受体位点和替代位点使用变化的最高关联SNP。
Most of the genetically associated splicing variation is cis
cis调控变异占所有关联的78-91%,其中40-60%的关联SNP位于剪接位点所在基因内部,50-60%位于相同外显子/内含子区域。
There are no major trans hotspots
虽然检测到trans关联(人类22%,拟南芥17%,果蝇9%),但未发现明显的转录热点,且未富集在剪接体蛋白编码基因区域。
Intronic regions drive most of the variation
32%(拟南芥)和9%(人类)的最高关联SNP位于剪接位点100bp范围内,且内含子区域SNP对剪接强度的影响最大。
High resolution GWAS allows inferring splice-promoting nucleotides
通过合成内含子实验验证:包含最佳剪接促进核苷酸的合成内含子(AT-rich)正确剪接,而最差序列(GC-rich)尽管保留GT-AG和分支点却完全不能剪接。
GT[N]4 and[N]4 AG hexamer sequences help explain splice-site choices
发现GT[N]4(供体)和[N]4AG(受体)六聚体能解释70.8%和60%的剪接位点选择,且六聚体使用频率与平均强度显著相关(R2=0.74),而非基因组背景频率。
Hexamer ranking explains splicing in perturbations
在Rosenberg等人的大规模迷你基因实验中,六聚体排序可解释66%的剪接选择,当六聚体强度差异>0.25时解释度达91%。通过改造RPS10和CALM3基因内含子的六聚体序列,成功实现剪接效率的定向调控。
研究结论表明,真核生物剪接位点选择遵循以六聚体排序为核心的保守逻辑框架。该框架虽不涵盖所有调控层级,但揭示了序列水平的基本规则:剪接位点强度主要取决于内含子六聚体序列,其排序与U1 snRNA结合特性高度一致;cis调控变异是自然群体中剪接变异的主要来源;跨物种六聚体排序的相关性反映了剪接机制的进化保守性。这项研究为理解遗传变异如何通过剪接调控表型多样性提供了分子基础,对农业性状改良和精准医疗中的剪接校正策略具有重要指导意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号