Yarrowia lipolytica MATA与MATB菌株的高精度基因组组装与注释:揭示DNA复制起始与基因沉默机制的新视角

《NAR Genomics and Bioinformatics》:Genome sequence assembly and annotation of MATA and MATB strains of Yarrowia lipolytica

【字体: 时间:2025年12月12日 来源:NAR Genomics and Bioinformatics 2.8

编辑推荐:

  本研究针对工业应用广泛的解脂耶氏酵母(Yarrowia lipolytica)基因组组装不完整、重复区域注释困难等问题,通过结合长读长(ONT/PacBio)与短读长(Illumina)测序技术,完成了MATA(E122)和MATB(22301-5)菌株的高质量基因组组装与注释。研究揭示了其独特的重复序列分布、rDNA端粒共定位特征及高内含子丰度,为解析该酵母DNA复制起源机制和基因沉默途径提供了关键基因组资源,对工业菌株优化和真核生物进化研究具有重要意义。

  
在真核生物中,DNA复制起始和基因沉默的机制是细胞生命活动的核心问题。解脂耶氏酵母(Yarrowia lipolytica)作为一种非传统酵母,因其强大的脂质和酶类合成能力被广泛应用于工业生物技术,但其基础分子生物学研究却相对滞后。与酿酒酵母(Saccharomyces cerevisiae)不同,Y. lipolytica缺乏典型的DNA序列特异性复制起始点识别机制和SIR蛋白依赖的基因沉默途径,其基因组中高比例的重复序列和内含子进一步增加了功能解析的难度。此前,由于测序技术的限制,Y. lipolytica的参考基因组存在大量缺口,端粒和rDNA等重复区域难以准确组装,阻碍了对其复制和沉默机制的深入探索。
为解决这一问题,冷泉港实验室的Bruce Stillman团队在《NAR Genomics and Bioinformatics》上发表了最新研究,通过对MATA(E122)和MATB(22301-5)菌株进行混合测序(牛津纳米孔长读长+Illumina短读长),完成了近乎完整的基因组组装,并首次系统注释了其重复元件分布和结构特征。
关键技术方法
研究采用杂交测序策略:通过牛津纳米孔PromethION平台获取长读长基因组DNA和cDNA序列,结合Illumina短读长数据进行校正。使用Flye进行基因组组装,Pilon进行抛光,并通过MAKER-P流程整合转录组和同源证据进行基因注释。重复序列通过RepeatMasker和EDTA进行识别,rDNA和端粒位置通过比对已知序列确定。
研究结果
1. 高质量基因组组装
通过长读长测序,E122 MATA和22301-5 MATB菌株的基因组总长度分别为21.02 Mb和21.01 Mb,覆盖度分别达1630×和2364×。组装结果包含7-8个连续片段,每条染色体均成功捕获端粒序列。BUSCO评估显示基因组完整性达96.8%,显著优于早期Sanger测序的CLIB122参考基因组。
2. 菌株间基因组结构高度保守
比较基因组学分析显示,E122 MATA与22301-5 MATB菌株的相似性得分高达0.997,仅存在微小变异。然而,与德国分离株DSM 3286的比较则揭示大量染色体倒位和易位,说明不同地理来源菌株存在显著结构分歧。
3. 基因注释揭示高内含子复杂性
E122 MATA和22301-5 MATB分别注释出7728和7769个蛋白质编码基因,其中约20%的基因含有内含子(CLIB122仅15%)。多内含子基因比例显著高于其他菌株,且内含子长度随位置靠近3′端而递减(最短40 bp,最长6782 bp),暗示其可能通过可变剪接增强环境适应性。
4. 重复序列塑造基因组进化
E122和22301-5菌株的重复序列占比达30%-40%,包括LTR反转录转座子、LINE元件和简单重复序列。与短读长组装的DSM 3286相比,长读长数据更完整地捕获了多拷贝重复单元,避免了序列塌陷问题。约650个基因与重复序列重叠,提示转座子可能调控基因表达。
5. rDNA与端粒共定位
rDNA重复单元(18S/28S)定位于染色体B、C、E、F的端粒邻近区域,单个簇长度可达11 kb。5S rDNA则分散于全基因组。这种结构可能与维持重复序列稳定性有关,尤其在该酵母缺乏RNAi和SIR蛋白的背景下。
结论与意义
本研究提供的高质量基因组资源揭示了Y. lipolytica独特的基因组架构:高重复序列含量、rDNA-端粒关联性以及丰富的内含子结构,为其适应工业环境提供了遗传基础。尤其重要的是,该酵母缺乏典型复制起始点识别域(Orc2-loop/Orc4-IH)和SIR沉默机制,却仍能维持基因组稳定性,暗示存在未知的复制调控和异染色质形成途径。未来通过比较其与酿酒酵母的复制起源模式,有望揭示真核生物复制起始机制的进化轨迹。此外,菌株特异性基因库(如1204个独有ortholog)为代谢工程提供了新靶点,推动Y. lipolytica在生物制造中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号