《Systematic Entomology》:Mixture models unveil the origin of the enigmatic Satyrinae butterfly genera Calisto and Llorenteana (Lepidoptera, Nymphalidae, Satyrinae)
编辑推荐:
研究人员提供了对两个亲缘关系不确定的神秘眼蝶亚科(Satyrinae)属起源的首个全面分析。Calisto Hübner,西印度群岛唯一的眼蝶亚科属,并特有于这些岛屿,无论使用何种数据类型或方法,都未能成功进行系统发育定位。Llorenteana Vilori
研究人员提供了对两个亲缘关系不确定的神秘眼蝶亚科(Satyrinae)属起源的首个全面分析。Calisto Hübner,西印度群岛唯一的眼蝶亚科属,并特有于这些岛屿,无论使用何种数据类型或方法,都未能成功进行系统发育定位。Llorenteana Viloria & Luis-Martínez,来自墨西哥西北部的单型属,从未被纳入分子系统发育研究,过去的作者将其置于五个不同的属和亚族中。研究人员不仅使用了大部分已发表的基因组数据,还使用了博物馆标本和旧DNA提取物中新测序的全基因组数据,提取了BUSCO基因并准备了多个数据集。这些数据集在异质性和饱和程度、所使用的核苷酸位置数量(所有位置或仅前两个)上有所不同,并作为核苷酸或氨基酸进行分析。研究人员采用了最大似然法,使用分区模型和混合模型,以及多物种溯祖法ASTRAL,来推断系统发育关系。此外,研究人员估计了Calisto和Llorenteana的分歧时间和祖先起源区域。当使用分区模型和ASTRAL时,Calisto的系统发育位置在不同数据集间有所变化;然而,在混合模型下,尽管不完全谱系分选和基因流影响了数据,大多数数据集得出了相同的拓扑结构。研究人员的分析结果表明,Calisto是一个旧世界起源支系的一部分,该支系从北向南殖民新世界,因此与近北区(Nearctic)分类群共享祖先。Llorenteana的位置在所有分析和数据集中保持稳定。它构成了新热带区起源的Euptychiina亚族内部最早的分支之一,但与Pronophilina亚族一起从近北区祖先分化而来。研究人员提出承认Erebiina stat. rev.作为唯一包含先前Calistina syn. nov.、Callerebiina syn. nov.、Maniolina syn. nov.和Ypthimina syn. nov.的亚族。
**研究背景与科学问题**
眼蝶亚科(Satyrinae)是蛱蝶科(Nymphalidae)中最大的亚科之一,包含约2800个已知物种,其中近一半分布在新热带区。尽管分子系统发育研究已澄清了该亚科内部多数主要支系的关系,但族Satyrini内部的亚族结构仍不明确,多个属的系统发育位置悬而未决。**Calisto** Hübner属是西印度群岛唯一且特有的眼蝶亚科属,尽管过去二十年中多次利用不同数据类型和方法进行系统发育分析,其亲缘关系始终未能稳定确定,常出现位置多变且支持率低的情况。**Llorenteana** Viloria & Luis-Martínez属是一个来自墨西哥西北部的单型属,其唯一物种曾先后被归入五个不同属和亚族,但从未被纳入分子系统学研究。这两个属的系统发育难题主要源于Satyrini内部的快速辐射导致短枝长、谱系间速率异质性、不完全谱系分选(ILS)和基因流(GF)等因素,而传统的分区进化模型可能无法充分应对这些复杂性。因此,明确这两个属的演化位置对理解眼蝶亚科的生物地理格局和分类体系具有重要意义。该论文发表在《Systematic Entomology》。
**关键技术与方法**
研究人员构建了包含69个代表类群(涵盖所有Satyrini亚族及外群)的核心数据集,其中31个基因组组装和37个原始数据下载自NCBI,同时新测序了3个**Calisto**物种(来自12年前的DNA提取物)和1个**Llorenteana pellonia**标本(1984年采于博物馆,提取自腿部组织)。利用**buscophy**工作流程提取BUSCO基因,经多序列比对、异常值剔除和过滤后,制备了9个不同饱和度和组成偏差的数据集(核苷酸全密码子位点NT123、前两个位点NT12、氨基酸AA等)。主要方法包括:(1)IQ-TREE 2.2.6进行最大似然法推断,分别使用分区模型(ModelFinder选择最优分区)和混合模型(MixtureFinder 4类模型及GHOST模型);(2)ASTRAL-IV推断多物种溯祖树;(3)**aphid**程序分析ILS和GF对系统发育信号的影响;(4)RelTime-ML估计分歧时间,以已发表的蝴蝶年代系统树作次级校正点;(5)BioGeoBEARS进行祖先区重建,划分7个生物地理区并设置约束条件。
**研究结果**
**1. 数据集、组成偏差和饱和(Datasets, compositional bias and saturation)**
通过BaCoCa分析,发现不同基因的饱和度和组成频率变异(nRCFV)范围较大。主成分分析显示,**Calisto**及其近缘支系的碱基频率变异显著,第三位密码子贡献最大,但仅用前两位时仍存在高变异。
**2. 系统发育推断(Phylogenetic inference)**
在分区模型和ASTRAL下,**Calisto**的位置随数据集变化;仅NT123及其低组成偏差版本能完全解析其关系。而采用4类混合模型和GHOST模型后,所有核苷酸数据集均收敛于同一拓扑:**Calisto**与**Gyrocheilus**及一个包含Erebiina–Maniolina和Callerebiina–Ypthimina的支系构成姐妹群,该支系再与Pronophilina+Euptychiina互为姐妹。**Llorenteana**在所有分析中稳定位于Euptychiina亚族内,为**Euptychia**属之后的最早分支。
**3. 树比较与一致性因子(Trees comparison and concordance factors)**
混合模型(尤其GHOST)产生的树更长、内部枝长更大,且**Calisto**近缘支系中弱支持分支数量减少。基因一致性因子(gCF)和位点一致性因子(sCF)均值较低(分别为61.6和52.5),**Calisto**相关分支的gCF和sCF更低,提示基因树间存在广泛冲突。
**4. 不完全谱系分选和祖先基因流(Incomplete lineage sorting and ancestral gene flow)**
**aphid**分析676个三联体发现,顶级拓扑((Calisto, Erebiina), Pronophilina–Euptychiina))占优,但平均28.1%为无事件,19.3%归因于ILS冲突,35.2%归因于GF冲突。当设定替代顶级拓扑时,ILS和GF冲突比例升高,表明ILS和GF共同导致了系统发育信号的不一致。
**5. 分歧时间与祖先区估计(Divergence times and ancestral range estimation)**
不同数据集的定年结果一致显示**Calisto**与其近缘类群的分歧发生在晚渐新世–早中新世(约24 Ma)。最佳模型(DEC+J)支持**Calisto**祖先起源于近北区(Nearctic),概率达96.9%。整体分析表明,Satyrini中除Satyrina外的所有支系起源于旧世界,并从北向南殖民新世界。**Llorenteana**的祖先区定为新热带区。
**讨论与结论**
讨论部分指出,传统分区模型可能低估了分子进化的复杂性,而混合模型能更有效地捕捉异时性(heterotachy)和速率异质性,从而提供更稳定且支持率更高的拓扑。ILS和GF的存在解释了以往研究中**Calisto**位置多变的现象。生物地理分析支持**Calisto**从近北区经中美洲和加勒比海陆桥(而非南美洲GAARlandia假说)殖民西印度群岛,并强调早中新世以来的地质变迁可能促进了扩散。基于得到强支持的拓扑和生物地理格局,研究人员认为将**Calisto**及其所有近缘类群归入单一亚族更为合理。根据命名优先权,提议恢复Erebiina stat. rev.(以Erebia Dalman为模式属),并将Calistina syn. nov.、Callerebiina syn. nov.、Maniolina syn. nov.和Ypthimina syn. nov.视为其异名。这一分类调整简化了Satyrini的亚族系统,并强调了旧世界起源的Erebiina支系与新热带区Pronophilina+Euptychiina支系之间的深刻分化。