蛋白质编码基因外源子编码的小RNA亚类:调控机制与功能意义的新见解

【字体: 时间:2025年09月27日 来源:BMC Genomics 3.7

编辑推荐:

  本研究通过生物信息学分析发现201个小RNA(118个人类、83个小鼠)由蛋白质编码基因的表达外显子(5'-UTR、CDS、3'-UTR)编码,其中46个被MirGeneDB收录为miRNA。研究揭示了96%的宿主基因-小RNA关系未被认知,近50个小RNA嵌入典型ORF的编码外显子,表达分析显示其与宿主基因表达显著相关,为小RNA生物学和基因调控提供了新资源。

  
在基因调控的复杂网络中,小RNA(small RNAs)尤其是microRNAs(miRNAs)作为关键调控因子,通过转录后机制影响从发育到宿主防御等多种细胞过程。传统观点认为,大多数miRNAs来源于长链非编码转录本,而位于蛋白质编码基因外显子中的小RNA则因其可能破坏宿主mRNA稳定性而较少被关注。尽管早期生物信息学分析仅识别出6个人类miRNAs嵌入蛋白质编码基因外显子,且实验研究仅表征了少数案例如FSTL1/miR-198、DGCR8/miR-1306和miR-3618、C15orf48/miR-147b,但随着转录组数据的爆炸式增长,蛋白质编码mRNA作为小RNA宿主基因的普遍性仍不清楚。
为解决这一问题,Chang和Hancks在《BMC Genomics》上发表了研究,通过系统分析揭示了蛋白质编码转录本作为小RNA宿主基因的广泛性。他们发现201个小RNA(人类118个、小鼠83个)由蛋白质编码基因的外显子编码,其中46个被严格筛选的MirGeneDB数据库收录为miRNAs,且96%的宿主基因-小RNA关系此前未知。值得注意的是,近50个小RNA位于典型开放阅读框(ORF)的编码外显子内,提示在高等生物中重叠杂交基因可能比先前认为的更常见。表达分析显示,许多小RNA在不同人类组织中呈现差异表达,且与候选蛋白质编码宿主基因的表达模式显著相关,表明这些转录本可能作为小RNA的前体。这一发现不仅扩展了对小RNA生物发生的理解,还为研究特定宿主基因、小RNA功能及基因调控提供了宝贵资源。
研究采用的关键技术方法包括:从UCSC基因组浏览器和miRBase获取基因组坐标数据,使用BEDTools进行映射分析,利用RefSeq mRNA数据分类小RNA位置,并通过MirGeneDB进行miRNA验证。表达分析基于GTEx v10批量RNA-seq数据集,使用线性回归评估小RNA与宿主基因的相关性。序列保守性分析通过NCBI序列比对和UCSC基因组浏览器完成,疾病变异数据从ClinVar获取。
结果
多个小RNA位于蛋白质编码转录本的外显子中
分析发现,在1913个人类miRBase pre-miRNAs中,118个(29个在MirGeneDB中)位于蛋白质编码基因外显子且与宿主基因同向,其中96%的关系此前未被记录。小鼠基因组中 similarly 有83个pre-miRNAs(17个在MirGeneDB中)位于蛋白质编码基因外显子。这些小RNA广泛分布于5'-UTR、编码序列(CDS)和3'-UTR区域。
小RNA映射到蛋白质编码基因的非翻译区和编码外显子
人类小RNA中,25.4%位于5'-UTR(30个,5个在MirGeneDB),21.2%在CDS外显子(25个,4个在MirGeneDB),49.2%在3'-UTR(58个,20个在MirGeneDB)。小鼠小RNA中,31.3%在5'-UTR(26个,4个在MirGeneDB),25.3%在CDS(21个,4个在MirGeneDB),38.6%在3'-UTR(32个,9个在MirGeneDB)。32%的人类外显子小RNA显示Drosha依赖性加工证据。
选定外显子小RNA的表达 across 人类组织与候选蛋白质编码宿主基因的表达相关
GTEx数据分析显示,部分外显子小RNA(如hsa-mir-197-3p)组成型表达,而其他(如hsa-mir-935)表达变异较大。线性回归分析表明,10对小RNA-宿主基因对中,6对表达显著相关(p<0.01),包括hsa-mir-197-3p(GNAI3)、hsa-mir-24-1-5p(AOPEP)等,支持蛋白质编码基因作为小RNA前体转录本的角色。
讨论与结论
本研究通过大规模生物信息学分析,揭示了蛋白质编码转录本作为小RNA宿主基因的广泛性和重要性。201个小RNA(人类118个、小鼠83个)被鉴定为由蛋白质编码基因外显子编码,其中46个符合MirGeneDB的miRNA标准,且多数关系(96%)此前未知。这些小RNA分布于5'-UTR、CDS和3'-UTR,部分显示进化保守性和Drosha依赖性加工特征,如嵌入B2M 3'-UTR的miR-10393、VMP1 3'-UTR的miR-21、ZAP 3'-UTR的miR-10399等。值得注意的是,CDS内小RNA的发现(如PINK1/miR-6084、TMEM94/miR-6785、NPC2/miR-4709)提示重叠杂交基因在高等生物中可能更常见,且这些宿主基因多与免疫功能和应激响应相关。
表达分析进一步支持了宿主基因与小RNA的共调控关系,为理解其生物学功能提供了基础。尽管许多小RNA具有miRNA特征,但部分可能通过非典型机制功能或作为宿主mRNA调控的副产品。例如,miR-147b在应激诱导下表达并可破坏宿主基因C15orf48的稳定性,体现了可逆的转录后开关潜力。
该研究不仅提供了小RNA-宿主基因关系的综合资源,还为未来实验研究指明了方向,如探讨这些双顺反子转录本在疾病中的调控作用、小RNA加工对宿主基因功能的影响以及其作为治疗靶点的潜力。总体而言,这项工作深化了对小RNA生物发生和基因调控网络的理解,强调了蛋白质编码基因在小RNA生产中的重要作用,对生命科学和医学研究具有深远意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号