评估不同分类尺度下的系统基因组学研究用探针设计:在研究不足的类群(软体动物门:多板纲)中应用超保守元件的首步
《Molecular Ecology Resources》:Evaluating Probe Design for Phylogenomics Across Taxonomic Scales: First Steps for Applying Ultraconserved Elements in an Understudied Class (Mollusca: Polyplacophora)
【字体:
大
中
小
】
时间:2025年11月15日
来源:Molecular Ecology Resources 5.5
编辑推荐:
本研究针对新婚石螺类(Polyplacophora)设计并测试了超保守元素(UCE)探针集,结合基因组与转录组数据,成功构建了物种级系统发育树。混合探针集(MP)在基因组中捕获效率达63.6%,转录组中为23.3%,短侧翼(100bp)效果最佳,且优于现有双壳类和异鳃类腹足类探针集在新婚石螺类中的表现。
在分子系统学和进化生物学研究中,超保守元件(Ultraconserved Elements, UCEs)因其在不同物种间高度保守的特性,成为构建大规模系统发育树的重要工具。然而,尽管UCEs在其他动物类群中已被广泛应用,其在某些未被充分研究的类群中的应用却存在局限性。例如,现有的UCE探针集通常针对特定的类群,如双壳类(Bivalvia)或异腹足类(Heterobranchia)等,当这些探针集被应用于其他类群时,其性能往往不稳定。本文聚焦于一个尚未被充分研究的软体动物类群——多板纲(Polyplacophora,即海鞘类或“海鳞”),旨在开发专门针对该类群的UCE探针集,并评估其在系统发育分析中的有效性。
海鞘类作为多板纲的代表,具有显著的形态保守性,其最显著的特征是拥有八片钙质壳板,这一结构在数百万年的时间尺度上保持相对稳定。然而,海鞘类的多样性同样令人瞩目,目前已知的现存物种超过1000种。这种形态上的保守性与遗传多样性之间的矛盾,使得传统分子标记难以有效解析海鞘类内部的系统发育关系,特别是在属或种水平上。此外,海鞘类的基因组结构也表现出高度的变异性和频繁的染色体重排现象,这进一步增加了系统发育分析的复杂性。因此,开发专门针对海鞘类的UCE探针集具有重要的科学价值,不仅有助于解析其复杂的系统发育关系,还为利用历史标本进行系统发育研究提供了新的可能。
在本研究中,研究者利用已有的海鞘类基因组和转录组数据,设计并测试了新的UCE探针集。总共从海鞘类的基因组和转录组数据中鉴定出5730个UCE位点,并设计了19,080个探针。在基因组数据中,探针的平均捕获效率为55%,而在转录组数据中,平均捕获效率为20%。这一结果显著优于现有的海鞘类探针集。通过基于凝聚法(coalescence-based)的系统发育树构建,研究者成功地在种水平上解析了海鞘类的系统发育关系。研究还发现,较短的侧翼区域(flanking regions)在解析系统发育关系时表现最佳。在某些情况下,基因组和转录组数据即使来自同一物种,也可能在非优化方法下形成不同的分支群,这提醒我们需谨慎地将不同来源的数据整合使用。
研究者进一步分析了不同探针集在解析系统发育关系中的表现。例如,使用基于基因组的探针集(GP)和基于转录组的探针集(TP)进行分析时,它们在解析海鞘类系统发育关系时存在一定的局限性。尽管GP在某些情况下表现出较高的捕获效率,但在转录组数据中,其解析能力远低于基于转录组设计的探针集。同样,TP在基因组数据中的表现也不如GP。然而,混合探针集(MP)在基因组和转录组数据中均表现出更优的解析能力,其捕获的UCE位点数量是GP和TP的综合结果。MP不仅在基因组数据中平均捕获了3148个UCE位点,还在转录组数据中平均捕获了1152个位点,显著优于单独使用GP或TP的情况。这表明,将基因组和转录组数据结合使用,有助于提高系统发育解析的准确性和稳定性。
在实际应用中,探针集的性能不仅取决于其设计,还受到多种因素的影响,包括探针的侧翼区域长度、数据来源的完整性以及系统发育分析方法的选择。研究发现,侧翼区域长度的增加并未显著提高系统发育解析的精度,反而可能加剧基因组和转录组数据之间的分离,导致更多的错误分类。因此,较短的侧翼区域在解析系统发育关系时表现更优。此外,不同探针集在解析系统发育关系时的性能差异,也取决于其设计的侧翼区域长度。基于凝聚法的分析方法(如wASTRAL)在解析系统发育关系时表现出更强的稳定性,而基于拼接法(concatenated)的分析方法(如RAxML和IQTree)在处理转录组数据时容易出现分类错误,特别是在解析较浅的系统发育关系(如属或种水平)时。这说明,对于不同类群,选择合适的探针集和分析方法至关重要。
本研究还揭示了UCE探针集在解析系统发育关系时的稳定性。通过不同水平的过滤(如排除1%、10%或20%的异常位点),研究者发现系统发育树的拓扑结构基本保持不变,说明UCE探针集在系统发育解析中具有较强的鲁棒性。此外,研究者还发现,不同探针集在解析系统发育关系时的性能差异,主要源于它们的设计基础和数据来源。基于基因组设计的探针集(GP)在解析较深的系统发育关系时表现更优,而基于转录组设计的探针集(TP)则在解析较浅的系统发育关系时更有效。因此,为了最大化系统发育解析的准确性,研究者建议根据不同的系统发育尺度调整探针集的设计和使用。
本研究的结果对于未来的系统发育研究具有重要的指导意义。首先,它强调了为特定类群设计探针集的重要性,尤其是对于那些尚未被充分研究的类群。现有的探针集虽然在某些类群中表现良好,但在其他类群中可能无法有效解析系统发育关系。其次,研究还指出,整合不同来源的数据时,需注意数据间的兼容性。基因组和转录组数据虽然在某些情况下可以互补,但在没有充分优化的情况下,它们可能形成不同的分支群,影响系统发育树的构建。因此,未来的研究应更加注重探针集的优化和不同数据类型的整合策略。
此外,本研究还展示了UCE探针集在处理历史标本和保存样本方面的潜力。由于UCEs在基因组中具有较高的保守性,它们能够有效地从降解或片段化的DNA中捕获信息,这使得UCE探针集成为解析历史标本系统发育关系的重要工具。例如,许多罕见的海鞘类物种仅以干制或乙醇保存的标本形式存在,这些标本通常难以通过传统分子标记进行分析。然而,通过使用UCE探针集,研究者能够从这些标本中提取有用的序列信息,从而扩大系统发育分析的样本量。
最后,本研究还指出了未来研究中需要注意的几个关键问题。首先,UCE探针集的设计需要结合不同数据类型的特征,以确保其在不同系统发育尺度上的有效性。其次,系统发育分析方法的选择也至关重要,基于凝聚法的方法在解析较深的系统发育关系时表现更优,而基于拼接法的方法在解析较浅的系统发育关系时可能更有效。第三,数据的完整性和质量对系统发育解析的影响不容忽视,尤其是当数据来源不同时。因此,未来的系统发育研究应更加注重数据的筛选和优化,以确保解析结果的准确性。
总之,本研究通过设计和测试专门针对海鞘类的UCE探针集,不仅揭示了UCEs在解析系统发育关系中的潜力,也为未来的研究提供了重要的参考和指导。研究者希望这些探针集能够被广泛应用于海鞘类的系统发育研究,特别是在整合历史标本和现有基因组、转录组数据方面,从而推动对这一重要类群的深入理解。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号