
-
生物通官微
陪你抓住生命科技
跳动的脉搏
南美领巾蜥蜴中线粒体基因组捕获与核质不一致性的古老基因渗入解释
【字体: 大 中 小 】 时间:2025年10月11日 来源:Molecular Ecology 3.9
编辑推荐:
本研究通过整合线粒体基因组与核基因(UCEs和SNPs)数据,揭示了南美领巾蜥蜴(Tropidurus spinulosus类群)中核质不一致性(mitonuclear discordance)的进化机制。结果表明,该现象主要由古老基因渗入(ancient introgression)和中性 demographic 过程驱动,而非自然选择或不完全谱系分选(ILS)。研究强调了线粒体基因组捕获(mitochondrial genome capture)在物种形成和进化历史重建中的关键作用,为理解爬行动物谱系中复杂的基因流动模式提供了重要见解。
线粒体与核基因组在进化过程中常出现不一致的系统发育模式,这一现象被称为核质不一致性(mitonuclear discordance)。该现象可能由多种因素引起,包括基因渗入(introgression)、不完全谱系分选(incomplete lineage sorting, ILS)、种群数量波动、性别偏向扩散不对称性等。准确理解核质不一致性对重建物种进化历史至关重要,否则可能导致对物种边界、系统发育关系和历史生物地理模式的错误解读。
本研究以南美领巾蜥蜴Tropidurus spinulosus类群为模型,该类群包含9个物种,栖息于南美洲开阔的热带和亚热带环境。通过结合种群遗传学和系统基因组学方法,分析了线粒体和核DNA数据,旨在揭示现存物种祖先谱系中发生的基因流动事件,并探讨核质不一致性的进化驱动因素。
研究采用超保守元件(Ultraconserved Elements, UCEs)测序方法,对43只蜥蜴个体进行测序,样本主要分布于潘塔纳尔盆地及其周边干旱环境。测序工作由RAPiD Genomics公司完成,使用tetrapod 5k探针组进行目标富集,并在Illumina HiSeq 3000平台上进行双端测序。
使用Phyluce v1.7.1流程进行序列组装,通过Trimmomatic去除低质量碱基和接头序列,使用BBTools进行读长标准化。组装后的contigs通过SPAdes v3.15.5生成,并使用LastZ匹配UCE位点。序列比对采用MAFFT v7.471,修剪使用Gblocks,最终使用AMAS计算统计摘要。线粒体基因组从contigs组装中通过MitoFinder提取,并采用与UCE数据相同的流程进行比对。
选择具有最多UCE位点的样本作为参考,通过BWA将原始读长映射到contigs,使用SAMtools转换格式,Picard标记PCR重复,GATK进行indel重排和SNP calling。最终生成两个未连锁SNP数据集,分别包含40,265和27,454个SNP,用于后续分析。
使用IQ-TREE v2.2.6推断所有UCE位点和线粒体位点的基因树,支持率通过1000次超快自举计算。分区最大似然分析中,使用ModelFinder选择最佳模型,并通过ASTRAL v5.15.4从基因树推断物种树。此外,使用BPP v.4.6基于820个UCE位点估计物种树。
采用RelTime分支长度方法和MCMCTree v4.10进行分化时间估计。校准点设定为Tropidurus callathelys与其他物种的分化节点,参考时间点为10.74 Ma。使用SortaDate选择100个最具时钟性的UCE位点,并采用独立速率模型和HKY85模型进行分子钟估计。
使用五种方法评估网状进化:PhyloNetworks的SNaQ方法、PhyloNet的最大伪似然估计、NetRAX、D-suite的ABBA-BABA测试以及BPP的MSC-M模型。通过POPART v.1.7生成TCS单倍型网络,基于线粒体细胞色素c氧化酶基因(COX1、COX2和COX3)。
使用MEME、BUSTED、aBSREL和FUBAR测试线粒体DNA中的正选择证据。通过Tajima's D评估自然选择和种群大小变化,使用easySFS生成折叠SFS文件,并通过Stairway Plot v.2.18估计历史有效种群大小变化。
最终数据集包含43只个体的820个UCE位点,完整矩阵比对长度为725,505 bp。核DNA系统发育分析显示,样本可分为三个主要支系:Tropidurus sp. nov. + T. xanthochilus、T. lagunablanca + T. tarara、T. guarani + T. spinulosus + T. teyumirim,以及外类群T. callathelys和T. melanopleurus。线粒体DNA数据集产生明显不同的拓扑结构,表明存在显著的核质不一致性。
系统发育网络分析显示,模型中加入最多三个网状事件后拟合度提高,但这些事件主要发生在种内,而非关系不一致的物种间。ABBA-BABA测试未检测到显著的核基因混合。BPP下的MSC-M模型分析显示,现存物种间基因流极少,但祖先种群迁移率估计值较高,表明白垩纪基因流事件可能导致了观察到的核质不一致性。
线粒体DNA数据集分析显示,正选择证据有限。MEME识别出9个位点,FUBAR检测到2个位点,但BUSTED和aBSREL未发现任何分支存在显著的间歇性选择。核苷酸多样性(π)值在各种群间几乎相同,Tajima's D显著负值表明稀有变异过剩,可能与人口扩张有关而非选择。
BPP人口大小估计显示祖先种群存在差异,支持基因流方向的推断。EBSP结果表明,所有种群的线粒体有效人口规模显著增加,尤其在最近10万年。核数据集的Stairway Plot分析显示,约6万年前人口开始扩张,之后保持相对稳定。
UCEs作为高度保守的基因组区域,可能在检测基因流时存在局限性。然而,多种方法的应用(包括ABBA-BABA测试和系统发育网络)能够在不同时间尺度上捕获基因流事件,支持研究结论的可靠性。
研究发现核质不一致性主要由线粒体基因组捕获引起,而非核基因渗入。ILS的影响有限,系统发育网络和ABBA-BABA测试均未检测到显著的核基因混合。BPP分析显示,结合线粒体数据后迁移率估计值增加,表明白垩纪基因流事件在核质不一致性中起关键作用。
证据支持与人口相关的基因渗入假说:长期隔离、人口增长导致的二次接触以及生物地理信号。分化时间估计表明,物种分化从20 Ma开始,主要 speciation 事件发生在7.5-2.5 Ma之间。祖先种群大小差异促进了基因流的方向性,T. xanthochilus的较小种群大小可能促进了其中线粒体基因组的捕获。
分析未发现线粒体基因组存在强正选择证据。位点模型测试仅识别出少数密码子 under selection,核苷酸多样性估计和Tajima's D结果更支持历史人口变化而非选择。在蜥蜴中,线粒体功能受代谢需求约束较低,选择压力可能较小。
性别偏向扩散可能 contribute to核质不一致性。在近缘科中,雌性表现出强留居性,而雄性扩散更远,这可能促进了核基因流动但限制了线粒体继承。未来研究应探讨性别相关扩散在Tropidurus核质不一致性中的作用。
Matheus Salles负责研究设计、分析和主要撰写;Fabricius Domingos和André Carvalho负责研究设计、野外采样和基因组测序;其他作者参与野外采样、材料提供或实验室工作。所有作者阅读并批准了最终稿件。
感谢提供技术和材料支持的机构,以及协助野外工作的同事。文章处理费用由CAPES资助。
研究与发展中国家科学家合作,成果与科学界共享, addressing 优先关注问题。
作者声明无利益冲突。
生物通微信公众号
知名企业招聘