酵母新基因起源的跨膜倾向机制:非编码区polyA/T序列的关键作用

【字体: 时间:2025年07月13日 来源:Journal of Evolutionary Biology 1.9

编辑推荐:

  本研究破解了酵母基因组中非编码区(intergenic regions)为何富含跨膜结构域(TM domains)编码潜力的谜题。研究人员通过计算生物学方法,发现polyA/T重复序列(含polyA、polyT及TATA基序)是驱动这一现象的核心因素。这些序列不仅是核小体缺失区(NDR),更通过特定排列方式(如polyT/TATA邻近polyA)直接促进跨膜螺旋形成。该发现为"跨膜优先"(TM-first)的新基因起源模型提供了分子基础,揭示了基因组非编码区功能层面对蛋白质演化的深层影响。

  

论文解读

在生命演化进程中,全新蛋白质编码基因如何从非编码的基因组"荒漠"中诞生,一直是进化生物学的前沿问题。酵母作为模式生物,其基因组中年轻的新生基因(de novo genes)常被发现编码跨膜结构域(Transmembrane domains, TM domains),这一现象显著高于古老基因。早期研究推测这可能与非编码区的序列特性相关——酵母非编码区富含胸腺嘧啶(T),而T对应的密码子易编码疏水氨基酸(如亮氨酸、苯丙氨酸),从而增加跨膜倾向。然而,计算分析显示,仅凭T含量无法完全解释跨膜结构域预测频率的异常富集。这一矛盾暗示着更深层的基因组密码尚未破解:是什么隐藏的序列规则,让非编码区成为跨膜蛋白的"演化摇篮"?

为回答这一问题,希腊巴斯德研究所(Hellenic Pasteur Institute)与瑞士苏黎世大学(University of Zurich)的研究团队开展了一项系统性研究。他们通过计算模拟与进化追溯,揭示了非编码区中特定重复序列基序的核心作用。该研究首先构建了6,384个人工非编码开放阅读框(iORFs),即去除终止密码子后的酵母全基因组非编码区序列,并利用跨膜预测工具Phobius将其分为含跨膜结构域(TM+,3,544个)与不含跨膜域(TM-,2,628个)两组。通过基序富集分析工具MEME,团队在TM+ iORFs中鉴定出三类显著富集的DNA基序:polyA(连续A序列)、polyT(连续T序列)和TATA(AT重复序列)。其中polyT基序在TM+ iORFs中出现频率高达64%,远高于TM-组的24%(P=1.06e-83)。

关键方法

  1. 基序鉴定:使用MEME对TM+ iORFs进行DNA基序富集分析,并通过FIMO扫描验证基序位置分布。

  2. 功能验证:将基序序列随机替换为G/C碱基,重新预测跨膜结构域数量,评估基序对TM形成的因果贡献。

  3. 进化追溯:在28个严格筛选的非重叠新生基因及其祖先序列中搜索基序,比较酵母属物种间保守性。

  4. 跨物种分析:对比真菌古老基因(n=4,477)与新生基因的基序分布差异。

研究结果

1. 基序与跨膜结构域的时空耦合

跨膜螺旋编码区(占iORFs总长34.6%)集中了78%的polyT基序核苷酸(P<1e-16)和64%的TATA基序(P<1e-16)。当基序被随机替换为G/C后,77%含polyT的TM+ iORFs跨膜域数量减少(图1B),证明基序直接驱动跨膜潜力。

2. 基序排列的"语法规则"

polyA倾向于 flanking polyT或TATA基序(图1C-D)。在含多基序的序列中,polyT/TATA与polyA的相邻布局形成特定空间构型,最大化疏水氨基酸连续编码能力。

3. 新生基因的基序"遗迹"

在28个经系统发育验证的新生基因中,75%(9/12)的跨膜蛋白编码基因含polyT基序,且基序位于跨膜螺旋附近。而在真菌古老基因中,polyT基序几乎绝迹(0.13%, P<1e-16)。

4. 基序的进化保守性

16/28个新生基因的酵母属祖先序列已存在polyT基序,且其他酵母物种同源非编码区中广泛保留该基序(21/28个基因对应区域阳性),表明基序诞生远早于基因起源。

结论与意义

本研究发现酵母非编码区富含的polyA/T重复序列具有"双重生命":一方面,它们作为核小体缺失区(Nucleosome Depleted Regions, NDR)调控邻近基因转录;另一方面,其特定排列(polyT/TATA毗邻polyA)构成跨膜结构域演化的"预适应模板"。这种分子层面的多效性(pleiotropy)为"跨膜优先"(TM-first)的新基因起源模型提供了核心证据:新生基因从其非编码祖先处"继承"了高跨膜编码倾向,而跨膜域的细胞定位或降解信号(如C端疏水性介导的蛋白酶体降解)可能成为早期功能化的跳板。

该研究颠覆了"序列演化服务于单一功能"的传统认知,揭示基因组中同一段DNA可同时承载表观调控与蛋白质结构编码的"叠加态"潜能。这种机制或广泛存在于真核生物中,为理解基因起源的分子驱动力开辟了新路径。此外,polyA/T基序可作为新生基因的进化"指纹",助力在更多物种中甄别真正的de novo起源事件。


论文发表于《Journal of Evolutionary Biology》

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号