稻瘟病菌70-15参考基因组端粒到端粒(T2T)高质量组装与注释揭示病原体进化新机制

【字体: 时间:2025年05月08日 来源:Scientific Data 5.8

编辑推荐:

  为解决稻瘟病菌(Magnaporthe oryzae)参考基因组MG8版本存在大量缺口和重复序列未解析的问题,中国科学院遗传与发育生物学研究所团队通过PacBio HiFi和Hi-C技术,首次完成70-15菌株44.82 Mb核基因组和35.95 kb线粒体基因组的端粒到端粒(T2T)组装,预测12,100个蛋白编码基因和493个效应因子,为病原体基因组学研究和抗病育种提供黄金标准参考。

  

稻瘟病是全球水稻生产中最具毁灭性的真菌病害,每年造成10-30%的产量损失,足以养活6000万人。其病原体稻瘟病菌(Magnaporthe oryzae)自2005年首个真菌基因组MG8版本发布以来,虽已有350多个菌株基因组被测序,但作为核心参考的70-15菌株MG8版本因Sanger测序技术限制,仍存在157个缺口和大量未解析重复区域,严重制约了病原体进化机制和宿主互作研究。

为突破这一技术瓶颈,中国科学院遗传与发育生物学研究所的Hang-yuan Cheng、Li-ping Jiang等研究人员联合三亚崖州湾国家实验室,采用第三代测序技术PacBio HiFi(高保真长读长测序)结合染色质构象捕获(Hi-C)技术,对70-15菌株进行深度测序(HiFi覆盖度173×,Hi-C覆盖度186×)。通过Hicanu和Hifiasm双组装器优化,结合NextPolish多轮抛光,最终获得44.82 Mb的核基因组和35.95 kb的环状线粒体基因组,其中5条染色体实现端粒到端粒(T2T)完整组装,2条染色体解析单端端粒。新组装被命名为T2T 70-15,其重复序列占比达16.93%,显著高于MG8版本的11.78%,长末端重复(LTR)组装指数(LAI)提升至32.79(黄金标准为20),BUSCO完整性达97.6%。

关键技术包括:(1)PacBio HiFi长读长测序与Hi-C染色体构象捕获;(2)Hicanu/Hifiasm双组装器联合NextPolish纠错;(3)Merqury评估显示k-mer完整度99.6%;(4)效应因子预测采用SignalP v6.0、TMHMM v2.0和effectorP v3.0三重筛选。

主要研究结果:

  1. 基因组组装质量:T2T 70-15相比MG8版本新增3.79 Mb序列,N50达6.85 Mb,错误率降低7倍至2×10-6,Illumina短读长映射率提升至99.87%。
  2. 重复序列解析:通过LTR_retriever鉴定到1,720个LTR反转录元件(MG8仅1,114个),其中Gypsy/DIRS1类占比6.82%,揭示转座子在基因组进化中的重要作用。
  3. 基因注释升级:整合12个转录组数据预测12,100个蛋白编码基因,平均外显子长度574 bp;线粒体基因组注释显示14个核心基因和27个tRNA基因。
  4. 效应因子库扩充:鉴定到493个高置信度效应因子(含分泌信号肽且无跨膜结构域),为宿主-病原体互作研究提供新靶点。
  5. 结构变异验证:SyRI分析发现MG8版本中13/22的结构变异位于缺口附近,新组装纠正了这些潜在错误连接。

结论与意义:该研究建立的T2T 70-15基因组是首个稻瘟病菌黄金标准参考,其完整端粒和重复序列的解析为研究真菌染色体稳定性、效应因子进化及表观调控提供了全新视角。数据集已存入NCBI(PRJNA1210831)和国家基因组科学数据中心(PRJCA034974),将推动作物抗病育种和新型杀菌剂开发。研究团队特别指出,16.93%的重复序列占比和Gypsy/DIRS1元件的富集,暗示转座子驱动可能是稻瘟病菌快速适应宿主的关键机制,这一发现为理解植物病原真菌的基因组可塑性奠定了理论基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号