顶复门是一个多样化的专性寄生原生生物群体,包含超过6000种已描述的物种,还有无数物种有待进一步研究,其中许多具有重要的医学和兽医价值(Morrison, 2009; Votypka et al., 2016; Oberstaller et al., 2021)。值得注意的病原体包括引起疟疾的Plasmodium属(Haemospororida: Plasmodiidae),每年导致大量死亡(Venkatesan, 2025);Toxoplasma gondii(Eucoccidiorida: Sarcocystidae),感染了全球约三分之一的人口(Dubey, 2021);以及Eimeria属(Eucoccidiorida: Eimeriidae),它们会引起家禽和牲畜的严重球虫病(Bangoura and Bardsley, 2020; Blake et al., 2020; Mathis et al., 2025)。这些寄生虫的线粒体基因组(线粒体基因组)不仅因其原核起源和关键功能而成为潜在的药物靶点(Mather et al., 2007; Goodman et al., 2017; Collier et al., 2025),而且还是研究物种形成、进化关系和生态多样性的关键位点(Karadjian et al., 2016; Hikosaka et al., 2010, 2011b, 2011; Hikosaka et al., 2012, Hayakawa et al., 2012; Morgan and Godwin, 2017; Pacheco et al., 2018b, 2022; Léveillé et al., 2019; Kruth et al., 2020)。
顶复门线粒体基因组显示出显著的结构多样性。它们通常编码三个蛋白质编码基因(PCGs):细胞色素c氧化酶亚基I和III(COI和COIII)以及细胞色素b(COB),同时还包含分散在整个基因组中的高度片段化的核糖体RNA基因(rRNAs),但完全缺乏转运RNA基因(Pino et al., 2010; Hikosaka et al., 2013; Feagin et al., 2012; Berná et al., 2021; Collier et al., 2025; Kruth et al., 2025)。某些类群,如Cryptosporidium属,经历了极端简化,形成了缺乏基因组内容的线粒体体(Mathur et al., 2021, Collier et al., 2025),而其他类群如Toxoplasma gondii则表现出复杂的、多分子的结构,包含21个重复序列块(Namasivayam et al., 2021, Tetzlaff et al., 2024)。在已研究的形态中,单分子线性线粒体基因组(长度约为6.6 kb至11.1 kb)在Piroplasmida中占主导地位(Hikosaka et al., 2010, 2012, 2013, Schreeg et al., 2016),而环状串联体在Eimeriidae中被称为“6.2 kb元件”,在Haemosporida中被称为“6 kb元件”,这些元件高度保守且被广泛研究(Hikosaka et al., 2011a, 2011b, 2013, Berná et al., 2021, Kruth et al., 2025)。
其中,Eimeriidae和Haemosporida寄生虫由于它们的生物多样性和全球分布而得到了特别深入的研究。Eimeriidae以Eimeria属为代表,包含超过1800种物种(Duszynski, 2011, Votypka et al., 2016),而Haemosporida在MalAvi数据库中记录了超过5100个鸟类球虫基因谱系(数据访问日期:2024年10月18日)(Bensch et al., 2009),这些寄生虫经常导致单个宿主体内发生多种物种感染(Votypka et al., 2016, Valkiūnas, 2004)。例如,家鸡可能携带多达10种Eimeria物种(Blake et al., 2021)以及多种球虫谱系(Bensch et al., 2009, Hong et al., 2025),这使得病原体的准确检测变得复杂。传统的分子诊断方法,包括线粒体DNA条形码技术(例如Eimeriidae的COI;Haemosporida的COB)(Hellgren et al., 2004, Ogedengbe et al., 2011),往往无法区分混合感染和共感染,因为色谱图不明确,且无法检测到的次要基因型可能被误认为是单核苷酸多态性(Valkiūnas et al., 2006, Martínez et al., 2009, Yeo et al., 2022, Jackwood, 2023, Hong et al., 2025)。尽管辅助方法如多重PCR(Fernandez et al., 2003, Kumar et al., 2014, Ciloglu et al., 2019, Musa et al., 2024)或片段克隆(Pérez-Tris and Bensch, 2005, Megía-Palma et al., 2023; Vieira et al., 2023)可以解决一些问题,但它们受到扩增偏向于优势谱系的影响,引物不匹配限制了它们检测同种混合感染或新谱系的准确性,从而掩盖了真实的感染复杂性。值得注意的是,克隆的PCR产物的序列可能包含聚合酶错误,因此需要分析多个克隆以验证正确的序列(Bensch and Hellgren, 2020)。
虽然下一代测序技术促进了Eimeriidae和Haemosporida寄生虫的线粒体基因组组装(Tang et al., 2015, Karadjian et al., 2016, Ciloglu et al., 2020, Zhou et al., 2023a),但由于序列高度保守且缺乏参考基因组,它可能增加混合感染中出现嵌合体的风险(Pacheco and Escalante, 2023)。像Oxford Nanopore Technologies (ONT)这样的长读长测序平台已经开发出来,用于解决这些限制,为多寄生样本提供了基于扩增子的稳健替代方法(Jackwood, 2023, Huggins et al., 2024a, 2024b, Jiménez et al., 2024, Matoute et al., 2024, Cruz-Saavedra et al., 2024),并实现了几乎完整的线粒体基因组重建(Pacheco et al., 2024, Pacheco et al., 2025, Hong et al., 2025)。然而,ONT技术尚未在Eimeriidae和Haemosporida的完整线粒体基因组组装中得到广泛应用——鉴于线粒体基因组在系统发育推断和物种界定中的核心作用,这是一个重要的空白。本研究旨在通过建立一种新的集成工作流程来解决这些挑战:(1)一步PCR扩增完整线粒体基因组;(2)基于ONT的测序和组装以区分混合/共感染;(3)与传统DNA条形码技术的比较评估;(4)构建一个顶复门线粒体基因组参考数据库,以填补台湾的知识空白。