《Molecular Genetics and Genomics》:Mitochondrial genomes from RNA-Seq reveal phylogeny and selection in Mepraia (Hemiptera: Reduviidae)
编辑推荐:
尽管锥蝽作为克氏锥虫(Trypanosoma cruzi)的传播媒介在流行病学中具有重要意义,许多谱系的线粒体基因组资源仍然有限,制约了进化和比较分析。智利特有属Mepraia即是典型代表,尽管其在查加斯病生态学和媒介进化研究中具有重要性,其线粒体基因组信息仍
尽管锥蝽作为克氏锥虫(Trypanosoma cruzi)的传播媒介在流行病学中具有重要意义,许多谱系的线粒体基因组资源仍然有限,制约了进化和比较分析。智利特有属Mepraia即是典型代表,尽管其在查加斯病生态学和媒介进化研究中具有重要性,其线粒体基因组信息仍十分匮乏。研究人员从三种Mepraia物种的RNA-Seq数据中重建了包含所有13个蛋白质编码基因的部分线粒体基因组。系统发育分析证实了Mepraia的单系性,并解析了种间关系;比较分析揭示了种内多样性异质性模式,其中M. parapatrica的遗传变异较高。基于密码子的检测发现,氧化磷酸化基因普遍存在净化选择,同时在NAD5、NAD6、NAD1和COIII等基因中检测到局部的正选择信号。结果表明,转录组数据为非模式昆虫的线粒体基因组重建提供了可靠来源,并且适应信号可与强功能约束共存于锥蝽线粒体基因组中。该研究扩展了Triatominae的线粒体基因组资源,提升了Mepraia的进化推断水平,并为未来的多样化、线粒体进化和媒介生物学综合研究奠定了基础。
研究背景方面,锥蝽(Triatominae)是传播克氏锥虫(Trypanosoma cruzi)的主要媒介,对查加斯病的流行具有关键作用。然而,许多谱系尤其是智利特有属Mepraia的线粒体基因组数据稀缺,限制了对其进化历史及种群结构的深入解析。现有研究多集中在少数经济重要昆虫类群,非模式昆虫特别是医学媒介的线粒体基因组资源匮乏,阻碍了比较基因组学的发展。此外,传统线粒体基因组获取依赖全基因组测序或特异性扩增,成本高且受DNA质量影响大。在此背景下,利用公共转录组(RNA-Seq)数据重建线粒体基因组成为一种高效途径,既能填补Mepraia属的基因组空白,又能为锥蝽亚科的进化研究提供新视角。
关键技术方法上,研究人员使用了已发表的Mepraia三个物种(M. gajardoi、M. parapatrica、M. spinolai)第五龄若虫头及唾液腺组织的RNA-Seq数据,样本来源于自然种群并由NCBI SRA数据库获取(BioProject PRJNA916468)。采用MITObim软件进行参考引导的迭代诱饵与比对组装,参考基因组为亲缘种Triatoma infestans(NC_035547)。蛋白编码基因恢复辅以MitoGeneExtractor,注释使用MITOS并在无脊椎动物线粒体遗传密码下进行。系统发育分析基于13个线粒体蛋白编码基因的串联序列,分别用最大似然法(IQ-TREE 3)与贝叶斯推断(MrBayes v3.2.7)构建,模型选择与分区策略由ModelFinder Plus确定。遗传距离采用Kimura 2-参数(K2P)模型计算,主成分分析(PCA)用于遗传结构解析。选择压力分析使用HyPhy平台上的MEME、FUBAR及BUSTED方法检测位点特异性和支系特异性选择。
研究结果部分,首先在线粒体基因组组装与特征中,研究人员成功从RNA-Seq数据重建了18个部分线粒体基因组(每物种6个),长度约15,173–17,762 bp,均包含完整的13个蛋白编码基因,基因排列方向与参考一致,AT含量57.41%–66.76%,符合半翅目线粒体基因组特征。tRNA恢复程度因转录覆盖差异而异,未完全反映基因组结构差异。其次在系统发育分析中,基于13个蛋白编码基因的数据集,Mepraia三物种各自形成单系群并获得高支持率,M. spinolai为最早分化支系,M. parapatrica与M. gajardoi互为姐妹群;在包含69个锥蝽类群的扩展分析中,Mepraia稳定位于南美Triatoma分支的姐妹位置,与其他主要属(Rhodnius、Panstrongylus等)形成清晰地理谱系结构。第三在遗传距离与选择分析中,PCA与K2P距离显示物种间分化明显,M. spinolai种内多样性最低,M. parapatrica在ATP8与NAD3等快速进化基因中表现出更高的种内变异。选择分析表明NAD5、NAD6、NAD1和COIII存在多位点正选择信号,其余基因多为净化选择,BUSTED分析未发现全基因水平的正选择。
讨论部分,研究人员指出转录组数据可有效重建非模式昆虫线粒体蛋白编码基因,尽管非编码区覆盖率不足,但编码区序列与传统DNA来源结果高度一致,适用于系统发育与分子进化分析。Mepraia线粒体基因组结构保守,种间关系与既往线粒体及核基因研究吻合,验证了方法的可靠性。种内遗传多样性差异可能与历史种群结构、隔离及古代杂交事件有关,快速进化基因如ATP8更易积累种内变异。选择分析揭示氧化磷酸化通路中Complex I与Complex IV组分存在局部适应性进化,反映了功能约束下的精细选择过程。该研究的成果不仅丰富了锥蝽亚科的线粒体基因组资源,也为今后的种群遗传学、谱系地理学及媒介生物学综合研究奠定了分子基础。论文发表于《Molecular Genetics and Genomics》。
研究结论部分翻译:基于RNA-Seq重建的Mepraia线粒体基因组为该类群的单系性及种间关系提供了有力证据,同时揭示了在强净化选择背景下存在局部适应性进化的种内变异异质性。这一结果证明公共转录组数据可高效用于非模式昆虫的线粒体编码基因资源开发,拓展了Triatominae的比较基因组学框架,并为未来结合线粒体、核基因组及生态功能数据的综合研究提供了基础。