多样化参考基因组揭示美国冬小麦变异检测中的参考偏好性

《The Plant Genome》:Diverse reference genomes detect variants in the US winter wheat

【字体: 时间:2026年01月01日 来源:The Plant Genome 3.8

编辑推荐:

  本文通过比较中国春(CS)、Jagger(JG)和人工合成小麦Durum-tauschii(DT)三种参考基因组对29份美国南部大平原冬小麦种质进行重测序分析,系统评估了参考基因组选择对变异检测(SNP/INDEL)、等位基因多样性、基因共线性以及外源片段(如2NvS、1RS、Gb3)鉴定准确性的影响。结果表明,与当地种质遗传背景更接近的JG参考基因组能保留更多有效变异,减少缺失和杂合错误,凸显了多参考基因组在精准捕获小麦遗传多样性中的必要性,为作物基因组研究中的参考偏好性问题提供了重要见解。

  
1引言
在基因组学时代,参考基因组是遗传学研究不可或缺的工具。随着测序技术的发展,短读长测序数据的产生量大幅增加,将序列比对到参考基因组已成为变异发现过程中的关键环节。首个六倍体面包小麦参考基因组于2018年由国际小麦基因组测序联盟发布,其材料为中国春,并被视作行业标准。然而,使用单一参考基因组可能导致偏差,特别是当分析材料的遗传背景与参考基因组差异较大时。本研究旨在探讨不同参考基因组对美国南部大平原冬小麦种质变异发现的影响。
2材料与方法
研究材料包括29份适应北美南部大平原地区的六倍体小麦品种或优良品系,其全基因组测序深度在5倍至20倍之间。测序数据与三个参考基因组进行比对:Jagger(JG,美国堪萨斯州立大学品种,与供试种质相似度高)、中国春(CS,当前行业标准)以及Durum-tauschii(DT,由四倍体硬粒小麦参考基因组和野生Aegilops tauschii参考基因组通过计算机杂交拼接而成,作为非代表性参考)。使用BWA-MEM2进行序列比对,利用BCFtools调用单核苷酸多态性(SNP)和插入/缺失(INDEL),并基于次要等位基因频率(MAF)、缺失率和杂合度进行过滤。通过TBtools和GENESPACE进行基因共线性分析,利用比对覆盖度数据鉴定大片段外源导入事件。
3结果
3.1参考基因组比较
三个参考基因组的染色体长度存在差异,DT与CS/JG之间的差异最大。JG与CS参考基因组在D基因组上的差异最大,平均达9.6 Mb。JG参考基因组在B亚基因组上表现出显著更高的覆盖度。
3.2基因共线性
JG与CS参考基因组之间共有182,438个共线性基因,占总基因数的73.77%。CS与DT的共线性比例最高,为75.42%。正交群分析显示,DT参考基因组包含最多的正交群(85,615个),而CS参考基因组中分配到正交群的基因比例最高(95.5%)。所有参考基因组中,仅有48.8%的正交群在所有三个参考基因组中保守存在,表明存在大量的泛基因组成分。
3.3比对统计
DT参考基因组具有显著更多的补充比对读长和跨染色体配对读长。JG参考基因组具有显著更低的映射质量为0的读长比例、更低的碱基错误率、更少的缺失等位基因和更多的参考等位基因,表明JG最能代表所比对的种质。
3.4变异发现
原始变异数量以DT最多(275,783,108个),其次为CS和JG。经过MAF 5%过滤后,JG保留了最多的变异(12,739,519个),其次是CS和DT。在大多数染色体区段,过滤后变异的相对数量趋于一致,但在某些区域(如5A染色体末端)仍存在明显差异。
3.5外源片段鉴定
通过比对覆盖度分析,成功鉴定了携带Aegilops ventricosa2NvS染色体片段、1AL:1RS和1BL:1RS黑麦易位以及含有绿bug抗性基因Gb3的单倍型的品系。例如,与CS参考基因组相比,使用JG参考基因组时,携带2NvS片段的品系在2A染色体上的覆盖度增加了约2%。对于Gb3单倍型,通过组装未比对到CS的读长,构建了一个2.8 Mb的contig(tamGB3),用于区分携带和不携带该单倍型的品系。
3.6变异效应预测
在过滤后的MAF5数据集中,CS参考基因组预测出最多的“高”影响变异(8,591个)和“中度”影响变异(60,463个)。JG参考基因组具有最高比例的基因间区变异(86.34%),而CS和DT在编码区(外显子)、非编码区(内含子)等区域发现的变异相对更多。
4讨论
本研究表明,参考基因组的选择对变异发现具有显著影响。使用与分析材料遗传背景更接近的参考基因组(如JG)可以减少比对错误,提高变异检测的准确性,并更有效地鉴定结构变异和外源导入片段。正交群分析揭示了小麦中存在大量的非核心基因组,强调了单一参考基因组的局限性。通过覆盖度分析鉴定外源片段的方法为利用现有测序数据筛选种质资源提供了有效工具。随着泛基因组学的发展,构建包含多个单倍型的图形化基因组有望克服单一参考基因组带来的偏差。
5结论
选择合适的参考基因组对于准确发现变异和理解实验群体的遗传结构至关重要。了解不同参考基因组的保守和差异区域有助于根据具体研究问题做出最佳选择。在泛基因组学时代,利用多参考基因组或图形化基因组将有助于更全面地捕捉作物的遗传多样性。本研究为小麦及其它作物基因组研究中的参考基因组选择提供了重要参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号