利用高杂合度优势:文昌鱼减数分裂重组事件的全基因组直接检测揭示脊椎动物起源的保守机制

【字体: 时间:2025年10月07日 来源:Advanced Biotechnology

编辑推荐:

  本研究针对高杂合度文昌鱼基因组中减数分裂重组事件难以直接检测的问题,开发了基于Platanus-allee组装和家系测序的新型生物信息学流程。通过对104个子代的全基因组测序分析,首次实现了交叉互换(CO)和非交叉互换(NCO)事件的直接观测,发现两性重组率相似(4.66 cM/Mb vs 4.57 cM/Mb),揭示了大片段杂合倒置对CO冷区的形成机制,并证实了GC偏向基因转换(gBGC)的存在。该研究为高杂合度生物的重组研究建立了新范式。

  
在生命进化史上,文昌鱼作为脊椎动物的姐妹群,占据着揭示脊椎动物起源的关键位置。这种头索动物不仅保持着原始脊索动物的形态特征,更拥有令人惊讶的高杂合度基因组(3.2~4.2%),其杂合程度远超人类和大多数脊椎动物。这种高杂合性虽然为进化研究提供了丰富的遗传变异资源,却像一把双刃剑,给基因组分析带来了巨大挑战——特别是在减数分裂重组研究领域。由于传统方法依赖于短读长比对到参考基因组,高杂合度导致大量读段无法准确映射,使得重组事件的直接检测一直难以实现。
减数重组作为有性生殖生物的核心生物学过程,通过产生新的等位基因组合为适应性进化和遗传多样性维持提供动力。然而,当前对文昌鱼重组率的认知仅基于群体基因组变异反映的历史重组事件,缺乏对当代减数分裂事件的直接观测。研究人员迫切需要了解:在如此高杂合度的基因组中,重组事件如何分布?两性之间是否存在差异?哪些基因组特征影响着重组过程?
为了解开这些谜团,Tao等人在《Advanced Biotechnology》上发表了突破性研究。他们通过对佛罗里达文昌鱼(Branchiostoma floridae)两代家系(两个亲本和104个F1子代)的全基因组测序,开发了创新的生物信息学分析流程,首次实现了对交叉互换和非交叉互换重组事件的直接检测。
研究团队采用了几项关键技术:首先利用Platanus-allee这一专门为高杂合区域设计的单倍型组装工具,分别组装亲本基因组并作为子代读段比对的定制参考;基于子代读段与亲本基因组的比对结果,通过hapi软件进行亲本级contig单倍型定相;使用滑动窗口分析(5Mb窗口,1Mb步长)进行重组冷区识别;通过Minimap2比对和SVIM-asm检测大片段杂合倒置;采用GATK HaplotypeCaller模块进行NCO事件检测。所有分析均基于中国厦门大学和中山大学维护的文昌鱼实验种群。
2.1 减数分裂重组事件检测的工作流程
研究人员为106个个体(两个亲本和104个子代)分别生成了>50X的短读长测序数据。针对文昌鱼基因组的高杂合特性,他们开发了新颖的读段比对和变异调用策略:首先使用Platanus-allee分别组装亲本基因组,并将其合并作为子代读段比对的定制参考基因组。在Platanus-allee中,杂合区域被组装为具有两个等位基因序列的"气泡"contig,纯合区域则被组装为"非气泡"contig。父本基因组组装包含42,378对气泡contig(总长~466.3 Mb,平均contig长度~5.5 kb),母本包含43,292对(总长~389.9 Mb,平均contig长度~4.5 kb)。通过将子代测序读段与组装的亲本基因组进行比对,研究人员能够调用变异并确定每个子代继承了哪些亲本contig。
2.2 CO事件的特征分析
基于气泡contig在子代样本中的继承模式,研究人员以气泡contig为标记重建了每个亲本的亲本单倍型。他们在所有子代中共识别出2,329个父本减数分裂CO事件,平均每个减数分裂22.4个(范围:13-37)。母本减数分裂中识别出2,288个CO事件,平均每个减数分裂22.0个(范围:10-37)。调整不可调用区域后,父本的CO重组率为4.66 cM/Mb,母本为4.57 cM/Mb,高于哺乳动物(~0.5 cM/Mb)和鸟类(~2 cM/Mb)。与人类和其他一些脊椎动物中特定性别具有较高CO速率不同,在这个B. floridae家系中没有发现显著的性别偏向CO速率。
研究人员还识别了气泡contig内的推定CO断点,发现171个推定断点(95个父本和76个母本)。约90.6%的断点与通过气泡contig继承方法检测到的最近CO事件在1 Mb范围内,表明它们代表了相同的CO事件。
2.3 杂合倒置对CO事件分布的影响
分析基因组中的CO分布时,研究人员注意到虽然父本和母本染色体上CO事件的总体相关性较高,但存在没有任何CO事件的大基因组区域,这些区域在父本和母本基因组中有所不同。父本基因组有~209.1 Mb的CO冷区,母本基因组有~141.9 Mb的CO冷区。先前研究表明,大规模结构变异,特别是杂合倒置,可以抑制CO事件。文昌鱼基因组表现出显著升高的结构变异率,其易位和倒置速率约为人类-黑猩猩比较中观察到的30倍。
研究人员使用定相的单倍型信息搜索亲本中的大规模倒置,在亲本基因组中发现了四个大规模杂合倒置,所有这些倒置都位于CO冷区内。由于短读长测序数据组装的基因组限制,无法确认所有冷区是否都包含大的杂合倒置。但研究人员提出,这种杂合倒置可能是文昌鱼基因组中CO冷区形成的一个主要原因。
2.4 CO干扰分析
所有子代中25.8%(510/1976)的父本染色体和25.1%(495/1976)的母本染色体包含两个或多个CO。为了评估CO干扰,研究人员通过在这些染色体上随机 shuffling CO位置(排除先前定义的CO冷区)生成了预期的CO间距离分布。父本CO没有显示干扰证据,而母本CO表现出显著的负干扰——一个CO的发生增加了附近另一个CO的可能性。当仅考虑没有任何CO冷区的染色体时,母本CO的负干扰仍然成立。
2.5 CO事件与基因组特征的关联
研究人员进一步调查了CO速率与基因组特征之间的关系,包括转座元件(TE)密度、基因密度和GC含量。在父本和母本基因组中,TE密度与CO事件呈显著正相关(父本Pearson's r=0.43,母本r=0.40),表明TE可能是影响文昌鱼CO的一个因素。对不同TE类型的进一步分析显示,SINEs、LINEs、LTRs、MITEs和DNA转座子都与CO分布分别相关,没有对任何特定TE类别的明显偏好。基因密度也与CO事件相关(父本Pearson's r=0.28,母本r=0.26),但不如TE密度强烈。GC含量与父本CO没有显著相关,而在母本基因组中观察到弱负相关(Pearson's r=-0.12,p值=0.0164)。总体而言,父本和母本基因组显示出相似的模式:较高的TE和基因密度往往与较高的CO速率相关。
2.6 NCO事件的特征
除了CO事件,重组还可以产生NCO基因转换事件。由于NCO tract长度通常较短,检测NCO事件高度依赖于NCO周围信息丰富的杂合SNP标记的密度。B. floridae个体的高杂合度为识别NCO提供了独特优势。在父本基因组中,每个子代平均有73.0 Mb的基因组可分析NCO事件,检测到9,992个NCO(每个子代63-141个,平均96.1个)。在母本基因组中,每个子代平均有61.1 Mb可分析,发现5,850个NCO(每个子代25-114个,平均56.3个)。总体而言,在父本减数分裂中观察到更多的NCO事件。
大多数NCO事件在父本和母本基因组中涉及小基因组区域,90.9%小于200 bp,NCO事件的平均长度为99 bp。大多数NCO事件(83.6%)仅覆盖一个转换标记,这些NCO事件被认为是单SNP NCO,其余为多SNP NCO。关于转换类型,在父本和母本基因组中,A>G(或T>C)和C>T(或G>A)转换是最频繁的,可能与基因组中 inherently high proportion(55.7%)的A/G(或T/C)杂合位点有关。除了显示AT偏向的母本多SNP NCO外,研究人员在所有其他类型的NCO中发现了不同程度的GC偏向,父本基因组表现出更高的GC偏向。这表明gBGC也 contributes to NCO events in amphioxus。
研究人员还调查了父本和母本基因组中局部CO和NCO速率之间的关系(窗口大小5 Mb)。当包括CO冷区时,局部CO和NCO速率之间没有或相关性很弱。当排除CO冷区时,在父本基因组中发现局部CO和NCO速率之间存在相对较弱的相关性(Pearson's r=0.29,p=1.536x10-7),但在母本基因组中没有相关性。这表明该物种局部CO和NCO事件的频率在很大程度上是独立的。
C
C包括正链中的A>C和负链中的T>G,其他类型类似。e NCO转换偏向。根据每个事件覆盖的标记数量将NCO事件分为单SNP tract和多SNP tract。X轴描绘了([A/T>C/G]+[C/G>A/T])事件中A/T>C/G事件的比例。p值和95%置信区间(误差线)通过精确二项检验获得。p值显示在右侧,""表示p值<0.001,"*"表示0.001
这项研究通过对B. floridae家系106个个体的全基因组测序,系统分析了雄性和雌性减数分裂过程中的CO和NCO事件。文昌鱼个体的高杂合度使研究人员能够仅用短读长数据将亲本基因组组装成相对长的contig(平均长度~5 kb)。基于子代读段与亲本基因组(组装contig)的比对,研究人员在contig水平上进行了定相并重建了亲本单倍型。这种方法能够在没有直接配子测序的情况下对二倍体亲本进行定相,利用了文昌鱼基因组的高杂合度,将潜在的分析挑战转化为优势。高基因组杂合度还为检测NCO重组事件提供了高密度标记。
研究发现文昌鱼的估计CO重组率高于哺乳动物(~0.5 cM/Mb)或鸟类(~2 cM/Mb),但这种差异可能部分归因于文昌鱼相对于脊椎动物的紧凑基因组大小。事实上,每个单倍体染色体每次减数分裂的平均CO事件数约为1.2,接近脊椎动物。与许多脊椎动物不同,在这个家系的父本和母本基因组中没有发现显著的CO速率性别二态性,除了负干扰似乎在母本减数分裂中起作用而在父本减数分裂中没有。
父本和母本基因组都有许多CO冷区,可能是由于可以抑制CO事件的大规模杂合倒置。像高密度SNP一样,野生文昌鱼群体中可能存在许多多态性杂合倒置和其他结构变异。鉴于大规模杂合倒置可以抑制CO事件,不同个体之间的CO基因组分布可能存在巨大差异,导致直接测量的个体CO重组图与从群体基因组数据估计的历史CO重组图之间的相关性相对较弱。
此外,研究发现TE和基因密度与局部CO速率呈正相关,尽管导致这种相关的潜在分子机制尚不清楚。在许多脊椎动物中,PRDM9(具有锌指结构结合特定DNA序列并触发组蛋白修饰如H3K4me3/H3K36me3的蛋白质)的基因组结合谱决定了CO热点。由于缺乏文昌鱼物种的PRDM9 ChIP-seq数据,没有进行任何PRDM9相关分析,因此其在文昌鱼CO中的潜在作用仍然未知。
对NCO事件的分析表明,在文昌鱼中NCO事件发生的频率远高于CO事件,并且具有短的影响序列范围。与脊椎动物类似,文昌鱼也表现出gBGC,在转换过程中倾向于保留C/G等位基因。文昌鱼NCO事件的许多特征与脊椎动物相似,表明NCO事件的潜在机制在脊索动物进化过程中可能是高度保守的。
研究人员承认分析中存在几个局限性。首先,虽然使用气泡contig作为检测CO重组事件的标记提供了更高的特异性,但气泡contig源自基因组的 high heterozygous regions。这可能导致气泡contig的基因组分布不均匀, potentially causing an underestimation of recombination rates in regions with lower heterozygosity。其次,研究 sequencing a single family,因此可能存在由于小样本量导致的偏差。鉴于可能存在大量个体特异性杂合倒置可以抑制重组,这种限制尤其相关。因此,不能排除这种局限性可能掩盖群体水平上存在的一些差异,例如与性别相关的差异。
总之,通过对一个B. floridae家系106个个体的测序,研究人员全面绘制了文昌鱼雄性和雌性个体中的CO和NCO事件。这项研究填补了我们对文昌鱼重组理解的重要空白,增强了我们对文昌鱼群体遗传多样性的认识,为这一重要生物学模式生物的 future research提供了有力支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号