多聚谷氨酰胺重复序列的CAG/CAA密码子互作进化研究:跨物种比较揭示的保守模式与分类特异性特征

【字体: 时间:2025年06月10日 来源:NAR Genomics and Bioinformatics 4.0

编辑推荐:

  本研究通过分析30种真核生物模型物种的蛋白质编码转录本,揭示了多聚谷氨酰胺(polyQ)区域中CAG/CAA密码子使用的进化规律。研究发现不同物种中polyQ区域的密码子选择受复制滑动、结构约束和随机过程共同影响,其中CAA密码子倾向于分布在C端以限制CAG重复扩展,而四足动物则通过侧翼氨基酸(如脯氨酸)抑制polyQ聚集。该研究为理解polyQ区域在进化中的形成机制及神经退行性疾病相关重复扩展提供了新视角。

  

在真核生物蛋白质中,多聚谷氨酰胺(polyQ)重复序列广泛存在,这些由CAG或CAA密码子编码的低复杂度区域因其与亨廷顿病等神经退行性疾病的关联而备受关注。然而,现有研究多集中于人类和灵长类,跨物种的进化模式仍不清晰。更关键的是,CAG重复的异常扩展机制与CAA中断的保护作用尚未在宏观进化尺度上得到系统阐释。西班牙安达卢西亚发育生物学中心(CABD)的Antonio Moreno-Rodriguez团队在《NAR Genomics and Bioinformatics》发表的研究,通过比较30种真核生物(涵盖植物、真菌、无脊椎动物、鱼类和四足动物)的蛋白质组数据,揭示了polyQ区域编码策略的进化规律。

研究采用生物信息学方法分析Ensembl数据库的蛋白质编码转录本,通过Perl脚本识别纯polyQ区域(CAA/CAG连续序列),统计其长度分布、密码子使用频率及侧翼序列特征。利用Hamming距离量化密码子相似性,并通过随机模拟验证观察模式的显著性。

Glutamine codon usage across eukaryotes
研究发现物种间CAG密码子使用率差异显著:四足动物背景使用率最高(人类72.8%),而昆虫Apis mellifera仅32%。但所有物种(除鱼类外)均显示polyQ长度与CAG比例正相关,例如人类6个Q的 stretches中CAG升至83%。

特别的是,三文鱼(Salmo salar)含有异常多的单Q区域,可能是基因组多倍化所致。

CAA codons are placed C-terminally to CAG codons
在≥4Q的 stretches中,CAA显著偏向C端分布(19/30物种),如拟南芥和人类。这种"内部刹车"机制可能通过将易扩展的CAG突变为更稳定的CAA来限制重复增长。但真菌无此偏好,鱼类甚至呈现相反模式。

Codon mutation at polyglutamine flanking positions
纯CAG stretches的+1位密码子与CAG的Hamming距离(核苷酸错配数)显著小于-1位(四足动物10/10),表明C端更易发生终止重复的突变。

Amino acid context of polyglutamine stretches
四足动物长polyQ(≥8Q)的C端富含脯氨酸(形成PPII螺旋抑制β片层聚集),而无脊椎动物则偏好组氨酸。鱼类呈现过渡特征,兼具亮氨酸(N端)与脯氨酸/组氨酸(C端)。

The maximum number of consecutive identical codons
除鱼类外,连续相同密码子的最大长度符合随机预期。例如人类5Q区域中纯CAG概率(23.73%)与实际观测无差异,表明无主动选择压力限制纯CAG runs。

研究结论指出,polyQ区域的进化由随机过程(如复制滑动)与分类特异性约束(如四足动物的脯氨酸刹车)共同驱动。CAA的C端定位与外部突变机制构成双重保护,而tRNAGln
丰度可能影响密码子选择。该研究为理解polyQ相关疾病的物种易感性差异提供了进化框架,并提示鱼类独特的CAG维持机制值得深入探索。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号