多物种泛基因组揭示了种群规模对结构变异的广泛影响
《SCIENCE》:Multispecies pangenomes reveal a pervasive influence of population size on structural variation
【字体:
大
中
小
】
时间:2025年12月13日
来源:SCIENCE 45.8
编辑推荐:
通过长读测序和泛基因组分析,揭示北美三种 scrub-jay 种类的基因组结构变异与种群有效大小相关。小种群 scrub-jay 基因组更小,重复序列减少,而结构变异(如插入/缺失、倒位)数量与种群大小正相关,平均致病性高于单核苷酸多态性,仅在大型种群中存在适应性固定。基因拷贝数变异与种群大小负相关,影响基因表达。
编辑总结
结构变异,如基因组缺失、插入和倒位,因其适应性潜力而经常受到关注,但如果没有长读长序列测序技术,就很难系统地识别和研究这些变异。Edwards等人组装了三种北美松鸦的泛基因组,这些松鸦的种群历史各不相同。与其他研究不同,他们发现种群规模最小的物种拥有最小的基因组和最少的重复序列。研究人员认为,这种差异是由于这三种物种的祖先经历大规模扩张后,重复序列随机丢失所致。这些数据代表了非模式生物的首批泛基因组之一,有助于更好地理解影响结构变异的动态过程。——Corinne Simonti
结构摘要
引言
结构变异是一类多样的突变,包括插入、缺失、易位、倒位以及其他多核苷酸突变。结构变异的数量、染色体分布及其对适应性的影响,以及人口统计事件对其多样性和进化的影响,构成了进化基因组学的重要研究领域。然而,我们目前对这些问题的了解仍然有限,主要是因为现有的DNA测序和计算方法无法捕捉到结构变异的全部多样性。最近的一些研究表明,结构变异往往具有有害性,但大多数研究使用的是短读长序列测序方法,并将变异映射到单一参考基因组上。而基于种群规模的长读长序列数据集(涉及对同一物种内多个个体的测序和从头组装)能够更全面地捕捉结构变异的谱系,但这类数据集在人类以外的物种中较为罕见。使用“所有对所有”比对方法进行泛基因组组装(无需指定参考基因组)的情况在非模式物种中也较为少见,但这种方法能够更准确地描述结构变异的全貌。基于种群规模长读长序列数据的泛基因组为理解结构变异的完整多样性及其进化特性提供了重要途径。
研究背景
我们利用种群规模的长读长序列测序技术和泛基因组方法,研究了三种北美灌丛松鸦(Aphelocoma)的结构变异的多样性和进化情况。其中,分布广泛的伍德豪斯灌丛松鸦(Aphelocoma woodhouseii)的变异数量是人类基因组的六倍;而岛屿灌丛松鸦(Aphelocoma insularis)经历了严重的种群瓶颈效应,其变异数量仅为人类的十分之一,导致这三种物种的有效种群规模相差约55倍。我们对这三种松鸦物种的45个基因组进行了长读长序列测序,认为这类鸟类为应用比较群体基因组学方法来研究自然种群中结构变异的进化机制提供了理想的研究对象。
结果
我们的泛基因组研究揭示了这些亲缘关系密切的物种之间基因组大小的意外差异;发现了超过300万个插入-缺失多态性以及近45万个结构变异;有助于可视化这些变异的泛基因组特征;并量化了它们与鸟类基因组中重复序列(如高度动态的卫星序列)的相互作用。结构变异中最常见的是倒位,其中最长可达约3兆碱基的倒位在A. woodhouseii中最为丰富,其次是Aphelocoma coerulescens和A. insularis。这些变异平均而言比单核苷酸变异更具有害性,且仅在大种群规模的物种中可能具有适应性。基因拷贝数变异(如基因缺失)在所有物种中都普遍存在,但在种群规模最小的A. insularis中最为频繁,这进一步表明了其有害性。通过转录组分析,我们发现基因拷贝数的变化会影响基因表达,从而可能对生物体的功能产生可检测的影响。
结论
种群规模的长读长序列测序和泛基因组工具为我们提供了高分辨率的视角,用于观察这三类亲缘关系密切的物种中基因组结构、重复序列景观以及结构变异和基因拷贝数多样性的快速进化过程。在自然种群中使用泛基因组工具将有助于我们更好地理解结构变异的进化驱动因素。

不同有效种群规模下的泛基因组。
对45种灌丛松鸦(Aphelocoma)及其外群的长期读长序列测序和泛基因组分析揭示了动态的重复序列景观。大多数结构变异的丰富程度与有效种群规模成正比。基因拷贝数的缺失与种群规模呈负相关,并驱动基因表达的变化。统计分析表明,结构变异平均而言比单核苷酸多态性更具有害性,且很少具有适应性。
摘要
结构变异(SVs)在脊椎动物基因组中普遍存在,但其进化动态仍知之甚少。我们利用45个长读长序列从头组装的基因组和泛基因组工具,分析了三种亲缘关系密切的北美松鸦(Aphelocoma)中的结构变异,这些松鸦的有效种群规模相差55倍。研究发现基因组结构发生了快速进化,包括由于复杂卫星序列景观的变化导致的基因组大小减少了约100兆碱基。结构变异的动态略具有害性,其影响程度受变异长度和种群规模的影响,在最大种群中仅表现出明显的适应性固定现象。基因拷贝数变异与种群规模呈负相关,表明其具有强烈的有害性,并对基因表达产生显著影响。我们的长读长序列数据集和泛基因组分析展示了种群规模如何塑造基因组的复杂性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号