-
生物通官微
陪你抓住生命科技
跳动的脉搏
《BMC Biology》:High resolution of full-length RNA sequencing deciphers massive transcriptome complexity during zebrafish embryogenesis
【字体: 大 中 小 】 时间:2025年06月05日 来源:BMC Biology 4.4
编辑推荐:
为解决斑马鱼基因组注释不完整的问题,中国科学院水生生物研究所等机构的研究人员利用PacBio Sequel II平台对21个胚胎发育阶段进行全长转录组测序,鉴定出2113个未注释基因和33,018个新异构体,揭示了可变剪接(AS)和母源-合子转换(MZT)的动态调控特征,为脊椎动物发育机制研究提供了高分辨率资源。
斑马鱼(Danio rerio)作为模式生物,因其与人类基因的高度保守性(70%蛋白编码基因同源)和胚胎发育的透明特性,成为研究脊椎动物发育和人类疾病的理想模型。然而,现有斑马鱼基因组注释主要依赖计算预测和短读长测序数据,导致大量转录本(尤其是可变剪接异构体)未被准确识别。尤其在胚胎发生过程中,母源-合子转换(Maternal-to-Zygotic Transition, MZT)和合子基因组激活(Zygotic Genome Activation, ZGA)等关键事件伴随复杂的转录调控,但传统短读长RNA测序(RNA-seq)难以解析全长转录本结构,限制了发育机制的研究。
为解决这一技术瓶颈,中国科学院水生生物研究所、青岛理工大学、深海科学与工程研究所等机构的研究团队利用PacBio Sequel II平台的长读长测序技术,对斑马鱼从受精前到受精后6天的21个发育阶段进行全长转录组分析。研究不仅大幅扩充了现有基因组注释,还揭示了转录本动态表达与剪接调控的时空特征,相关成果发表于《BMC Biology》。
研究团队采用PacBio Iso-Seq技术构建21个发育阶段的cDNA文库,通过环形共识序列(CCS)分析和GMAP基因组比对,结合Cuffcompare进行转录本注释。利用H3K4me3组蛋白修饰数据和CAGE-seq验证转录起始位点(TSS),通过CPAT和TransDecoder预测编码潜能,并整合短读长RNA-seq数据量化表达动态。SUPPA2分析可变剪接事件,DESeq2鉴定差异表达转录本。
高分辨率全长转录组揭示大量新基因与异构体
研究获得平均每个阶段44,508条高质量全长转录本,比对至GRCz11基因组的成功率>99%。通过结构注释发现4.26%(2113个)为全新基因,66.54%(33,018个)为已知基因的新异构体。其中lncRNA在新型转录本中占比达36.49%,且多数在ZGA后显著增加。
多组学验证转录本可靠性
通过H3K4me3峰与TSS的重叠分析显示,83%的注释TSS和37%的新TSS具有表观遗传激活标记。CAGE-seq数据进一步支持76%的预测TSS。随机选取的20个新转录本经PCR和Sanger测序验证,ORF(开放阅读框)同源性分析表明89%的新蛋白编码转录本具有保守功能域。
发育阶段特异性表达模式
聚类分析将28,233个差异表达转录本分为15个阶段特异性表达簇。例如,Oblong期(对应中囊胚转换MBT)高表达的Cluster 7(767个转录本)富集染色质组装(chromatin organization)和DNA修复功能;Cluster 25(1080个转录本)则参与mRNA剪接调控。母源特异性转录本(147个)和合子特异性转录本(2866个)的鉴定为MZT研究提供新线索。
可变剪接动态调控
共鉴定34,059个AS事件,涉及外显子跳跃(SE)、内含子保留(RI)等7种类型。从1k-cell到Oblong期出现剪接事件高峰,如enpep基因在早期表达短异构体(仅含ERAP1_C结构域),后期转为长异构体(含Peptidase_M1和ERAP1_C双结构域),暗示发育阶段特异性功能分化。
该研究通过长读长测序技术构建了迄今最完整的斑马鱼胚胎发生转录组图谱,不仅解决了短读长技术无法准确识别全长异构体的技术难题,更为探索脊椎动物发育调控的分子机制提供了关键资源。发现的数千个新转录本和动态剪接事件,为理解ZGA、MZT等核心生物学过程提供了新视角。此外,研究中建立的跨组学验证策略(如H3K4me3/CAGE-seq联合分析)为其他物种的基因组注释提供了方法论参考。未来通过功能实验验证这些新转录本在胚胎发育中的作用,将有望揭示更多保守的发育调控通路。