基于基因组学筛选系统发育信息标记集以解析按实蝇属(双翅目:实蝇科)的进化关系
《Scientific Reports》:Identifying sets of phylogenetically informative markers for Anastrepha (Diptera: Tephritidae)
【字体:
大
中
小
】
时间:2025年10月02日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对按实蝇属(Anastrepha)系统发育关系因基因流和不完全谱系分选而存在高度冲突的难题,通过重新分析3170个直系同源基因数据集,评估了三种筛选策略(信息位点数量、位点一致性因子>60%、SortaDate算法)来识别能够准确解析该属进化关系的简化标记集。研究发现基于一致性和进化速率指标的标记子集产生的拓扑结构与全数据集分析一致,且具有更高的节点一致性和树状性,为复杂进化历史类群的系统基因组学分析提供了实用方法。
在昆虫分类学领域,按实蝇属(Anastrepha)是一个令人着迷又充满挑战的研究对象。这个包含300多种物种的属中,多个物种是拉丁美洲地区具有重要经济意义的农林害虫。然而,按实蝇属内的物种鉴定长期依赖于雌性形态特征,使得许多发育阶段的个体难以准确识别。更复杂的是,该属内的物种,特别是小条实蝇复合群(A. fraterculus complex)中的近缘种,存在着近期快速分化、基因流和不完全谱系分选等复杂的进化历程,导致不同遗传标记得出的系统发育关系常常相互矛盾。
这种"系统发育冲突"现象不仅困扰着分类学家,也严重影响了针对这些害虫的有效监测与控制。全基因组测序虽然为解决这一问题提供了希望,但其高昂的成本限制了在大规模地理样本中的应用。因此,寻找一组既能准确反映系统发育关系又经济实用的遗传标记,成为了当前按实蝇研究的关键挑战。
在这项发表于《Scientific Reports》的研究中,de Brito教授团队开展了一项创新性研究,旨在从3170个直系同源基因中筛选出最小化的标记集,这些标记不仅能够解析按实蝇属不同层次的系统发育关系,还能抵抗基因流和祖先多态性的干扰。研究人员重新分析了全基因组测序、完整基因组组装或转录组数据,涵盖36个样本的15个按实蝇物种,包括7个物种群和来自南美和墨西哥的小条实蝇复合群的17个样本,以及5个其他实蝇科物种作为外群。
研究的关键技术方法包括:基于最大似然法(ML)和多物种 coalescent 方法(ASTRAL)进行物种树推断;利用PhyParts进行基因一致性分析;应用三种策略(信息位点数量、位点一致性因子sCF>60%、SortaDate算法)筛选标记子集;通过Dsuite计算Patterson's D统计量(ABBA-BABA指标)评估基因渗入;使用BUSTED分析选择压力;以及利用Phykit估算进化速率和饱和度等参数。
研究人员通过超级矩阵(串联法)和多物种 coalescent 方法推断的物种树拓扑结构高度一致,且与先前分析结果吻合。尽管大多数与潜在有效分类群相关的支系具有高支持度(串联法的 bootstrap 支持率为100%,多物种 coalescent 法的后验概率为1.0),但不同基因间存在高度系统发育冲突。这一模式反映在一致性值(通过gCF、sCF或四重支持度衡量)低于50%,且在对比近缘分类群时趋于降低。小条实蝇复合群尤其表现出gCF支持值的显著变异(不同谱系为11%-70%),反映了近期分化和基因流的影响。
研究团队测试了三种筛选信息标记的策略:基于每个基因的信息位点数量(Info)、位点一致性因子高于60%且平均基因一致性因子高于50%(sgC60)、以及SortaDate(考虑二分支持度和最小化端点到根部的变异)。结果显示,sgC60和Sortadate策略产生的拓扑结构代表了所有样本,且位点间系统发育不一致性较低。虽然所有子集在与完整数据集比较时存在显著似然值差异(除sgC60_37外),但主要系统发育关系均得以恢复。Sortadate策略平均表现最佳,恢复了最高数量的节点(16个物种节点中的17个,总37个节点中的36个),且支持基因数量最多(超过52%)。
对子集中基因的多项系统发育和进化参数分析表明,这些信息位点周围的基因组区域在纯化选择下进化(ω值较低)。尽管存在进化信号,但基因组不同区域的不一致性很高,反映在平均节点间确定性值及其基因组分布上。sgC60和Sortadate子集的树状性和平均IC值显著高于随机基因子集,而info子集则较低。基因渗入估计值f4-ratio在info子集中显著较低,但这可能是由于缺少多个近缘样本所致。
这项研究的意义不仅在于学术探索,更有着重要的实际应用价值。按实蝇属包含许多对水果作物造成重大损害的有害物种,其中多数仅能通过合格的分类学家进行准确区分。开发用于识别这些物种的遗传标记提供了一种有前景的工具,可补充传统的形态计量方法。特别是对于目前无法基于形态识别的许多按实蝇雄性成虫、幼虫和蛹,拥有一组信息基因可以加速和改进鉴定过程,从而实现更高效和有针对性的控制。
de Brito团队的研究通过系统评估不同标记筛选策略,为复杂进化历史类群的系统基因组学分析提供了实用方法。这些精心筛选的位点不仅提高了系统发育分辨率,还减轻了冲突信号的影响,为按实蝇及其他具有类似进化挑战的类群研究奠定了重要基础。随着测序数据的日益普及,在按实蝇系统发育的更深处,特别是跨其多个分类群分布区进行基因组测序,将成为建立最有效信息位点识别方法的关键。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号