WMAF:一种用于真菌全线粒体基因组比对的新方法及其在系统发育分析中的应用

《Fungal Genetics and Biology》:WMAF: One novel method for whole mitogenome alignment in fungi and its application in phylogenetic analysis

【字体: 时间:2026年02月07日 来源:Fungal Genetics and Biology 2.3

编辑推荐:

  真菌线粒体全基因组对齐工具WMAF的开发与应用。针对真菌线粒体基因组大小差异大、易重组等问题,开发Python工具WMAF,通过识别保守基因组块实现全长对齐,解决传统工具对长序列和对齐精度不足的缺陷。应用WMAF对紫穗槐菌属等五个属的线粒体基因组进行对齐和系统发育分析,构建的基因组水平系统发育树与核基因单拷贝分析结果一致,验证了工具的有效性。

  
崔厚松|张莉|刘彤|林润茂
教育部热带植物病虫害绿色防控重点实验室,海南省农业微生物制剂研发工程中心,三亚育种繁殖研究所,海南大学热带农林学院,海口570228,中国

摘要

真菌线粒体基因组对于系统发育研究具有重要意义,然而,如何利用大小不一的完整线粒体基因组构建系统发育树仍然具有挑战性。近期,新注释的线粒体基因组数量急剧增加,这迫切需要自动化比对工具。为此,我们开发了WMAF,这是一种基于Python的新工具,通过识别和连接保守的基因组片段来比对完整的真菌线粒体基因组。该工具能够克服重组效应并防止重复位点的检测。我们进一步将WMAF应用于五个不同的属,包括PurpureocilliumFusariumSaccharomycesTrichodermaRhizoctonia,并生成了线粒体系统发育树,这些结果通过核基因组树得到了验证。该方法为推进真菌系统发育研究以及构建真菌生命树奠定了基础。

引言

真菌是一类极其多样化的生物,在农业、化工和制药等多个领域具有广泛应用(Peng等人,2021;Niego等人,2023)。它们的线粒体是细胞能量供应的关键细胞器(Rossmann等人,2021),其独特的基因组已成为进化研究的宝贵资源(Gray,2012)。对线粒体基因组的研究不断揭示了新的遗传和进化机制,包括高拷贝数、快速的进化速率、母系遗传、比核基因组更低的重组频率、物种鉴定、遗传多样性以及线粒体DNA的渗入(Gray,2012;Alexeyev等人,2013;Aguileta等人,2014;Lin等人,2015;Allio等人,2017;?rsted等人,2019;Lin等人,2021;Blair,2023;French等人,2023;Wang等人,2024)。有趣的是,对不同生活方式(包括内寄生虫、外寄生虫、寄生蜂、微捕食者和自由生活物种)以及运动能力(低、中、高三种类型)的动物线粒体基因组的比较分析表明,线粒体的进化速率受到生活方式和运动能力的影响(Jakovli?等人,2023)。
与核基因组树类似,线粒体系统发育树也是解析物种进化关系的有力工具。真菌线粒体拥有自己的基因组和遗传系统。真菌线粒体基因组显著小于核基因组。例如,在Trichoderma breve中,核基因组大小为38.6 Mb,而线粒体基因组大小为26.2 kb(Wang等人,2024)。线粒体基因组的小尺寸使得获取完整基因组更加容易,从而有助于在生命树中解析新的真菌谱系。以往的真菌线粒体系统发育分析主要基于14个典型蛋白质编码基因(cox1cox2cox3cobnad1nad2nad3nad4nad4Lnad5nad6atp6atp8atp9)的串联序列。由于存在正选择下的进化证据,rps3基因被排除在这些分析之外(Lin等人,2015;Lin等人,2021;Kang等人,2017)。然而,越来越多的证据表明,整个线粒体基因组蕴含着重要的系统发育信息。例如,基于60个Trichoderma菌株的完整线粒体基因组序列(大小从26,276 bp到94,608 bp不等)构建的系统发育树与基于核单拷贝基因的系统发育树一致(Wang等人,2024)。然而,充分利用整个线粒体基因组的信号具有挑战性。真菌线粒体基因组存在大小差异,并且容易发生重排事件(Sulo等人,2017;Liang等人,2017;Zhang等人,2020;Li等人,2001)。此外,由于真菌的完整线粒体基因组几乎是环状的,因此需要在多个线粒体基因组中识别相同的位点,以便将其分割成线性序列进行全长比对。现有的多序列比对工具(如MUSCLE)并未针对这些复杂性进行优化,处理长序列时可能会出现错误(图S1)。因此,开发一种自动化的完整线粒体基因组比对方法至关重要。
在这项研究中,我们开发了WMAF(真菌全线粒体基因组比对),这是一种用于全长线粒体基因组序列比对的流程。它可以自动化比对序列,无需额外处理线粒体基因组的大小差异、重排以及多个线粒体基因组中相同位点的识别。我们应用WMAF对五个真菌属的线粒体基因组进行了全长比对,包括子囊菌门的PurpureocilliumFusariumSaccharomycesTrichoderma,以及担子菌门的Rhizoctonia。利用这些比对后的序列,我们构建了全线粒体基因组系统发育树,并进一步将其与核单拷贝基因、线粒体蛋白质编码基因的氨基酸(PEP)和核苷酸(CDS)序列的系统发育树进行了比较。我们的流程为真菌系统发育研究提供了一种新的工具,有助于深入探讨真菌的遗传进化。

部分内容

真菌线粒体基因组和核基因组的收集

基因组数据主要来自五个真菌属,包括PurpureocilliumFusariumSaccharomycesTrichodermaRhizoctonia
对于Purpureocillium物种,我们分析了14个线粒体基因组(表S1),其中包括三个P. lilacinum WS1608、P. lavendulum YMF1.00683和P. takamizusanense PT3(Li等人,2019;Liang等人,2021;Nguyen等人,2022),这些数据来自美国国家生物技术信息中心(NCBI),以及11个新组装的P. lilacinum菌株

WMAF的开发

我们成功开发了WMAF(图1),这是一个旨在克服全线粒体基因组系统发育分析中比对挑战的流程。具体来说,这些挑战包括:(1)如果基因组发生重组,序列比对将受到影响。例如在Saccharomyces物种中,不同菌株之间存在显著的重组事件(Sulo等人,2017);(2)MUSCLE(v3.8.31和v5.3)无法正常处理大型序列,如长度超过一定范围的序列

讨论

我们应用WMAF流程分析了不同大小的线粒体基因组(表S1、S3、S5、S7和S8)(Lin等人,2021;Sulo等人,2017;Liang等人,2021;Nguyen等人,2022;Al-Reedy等人,1998;Nakao等人,2009;Baker等人,2015;Strope等人,2015;Wu等人,2015),这些基因组来自五个生态上不同的真菌属,包括生物防治剂(PurpureocilliumTrichoderma)(Wang等人,2016;Woo等人,2023)和植物病原体(FusariumRhizoctonia)(Ma等人

结论

我们提出了一种名为WMAF的新方法,用于比对大小不一的真菌线粒体基因组。比对后的序列随后被用于系统发育分析。该方法已成功应用于PurpureocilliumFusariumSaccharomycesRhizoctoniaTrichoderma五个属的菌株分析。基于WMAF分析的全线粒体基因组序列、线粒体蛋白质编码基因的CDS和PEP以及核单拷贝基因,构建了四个系统发育树

CRediT作者贡献声明

崔厚松:撰写——原始草案,可视化,方法学,正式分析。张莉:可视化,方法学,正式分析。刘彤:监督,方法学,概念化。林润茂:撰写——审稿与编辑,监督,项目管理,方法学,资金获取,概念化。

资助

本工作得到了国家自然科学基金(编号32360641)的支持。

利益冲突声明

作者声明他们没有已知的利益冲突或个人关系可能影响本文所述的工作。

致谢

我们感谢实验室所有成员对本研究的宝贵建议和评论。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号