染色体水平组装五份芸薹属基因组拓展抗病基因库
《Scientific Data》:Chromosome level assembly of five Brassica rapa and oleracea accessions expand the resistance genes reservoir
【字体:
大
中
小
】
时间:2025年12月12日
来源:Scientific Data 6.9
编辑推荐:
本研究针对甘蓝型油菜(B. napus)遗传多样性低、抗病性差的问题,通过对二倍体祖先种白菜(B. rapa)和甘蓝(B. oleracea)五个品种进行染色体水平基因组组装,结合多器官RNA-Seq数据注释,显著提升了基因组完整性与基因注释精度,新鉴定出122-200余个特有抗病基因类似物(RGAs),为芸薹属作物抗病育种提供了宝贵的基因资源。相关成果发表于《Scientific Data》。
在芸薹属作物家族中,甘蓝型油菜(Brassica napus)作为全球重要的油料作物,却面临着遗传多样性严重匮乏的困境。由于其多倍体起源和长期人工选择,特别是针对种子品质性状的选育,导致其基因库变得日益狭窄。这种遗传基础的脆弱性使得甘蓝型油菜在面对病虫害威胁时显得尤为脆弱,而病害如黑胫病、根肿病和白绢病等严重制约着油菜的产量和品质。
有趣的是,甘蓝型油菜的两个二倍体祖先——白菜(Brassica rapa)和甘蓝(Brassica oleracea),却拥有丰富的遗传多样性。白菜和甘蓝大约在400万年前从共同祖先分化而来,经过独立的人工选择,形成了形态各异的品种。甘蓝产生了花椰菜、羽衣甘蓝、卷心菜等多样变种,而白菜则包括大白菜、小白菜、芜菁等。这些二倍体物种因此成为改良甘蓝型油菜的重要基因库,特别是用于导入抗病性等优良农艺性状。
然而,要充分利用这些遗传资源,首先需要深入了解其基因组特征。随着第三代测序技术的出现,染色体水平的基因组组装已成为可能,这为精准识别和克隆关键基因,特别是抗病(R)基因提供了有力工具。但单个参考基因组难以捕捉物种水平的遗传多样性,因此构建泛基因组显得尤为重要。先前研究表明,抗病基因类似物(Resistance Gene Analogs, RGAs)在芸薹属中存在显著的存在-缺失变异,分别占甘蓝和白菜可变基因组的12%和30%。这意味着要全面挖掘抗病基因资源,需要对多个具有代表性的品种进行高质量基因组组装。
在这一背景下,由法国农业科学院(INRAE)等机构的研究团队在《Scientific Data》上发表了最新研究成果。他们利用牛津纳米孔技术(Oxford Nanopore Technologies)和Illumina测序技术,对三个甘蓝品种(包括一个野生型)和两个白菜品种进行了染色体水平的基因组组装,并利用多器官RNA-Seq数据进行了基因注释,特别聚焦于抗病基因类似物的鉴定,极大地扩展了已知抗病基因的储备。
研究团队采用了多项关键技术方法:利用牛津纳米孔长读长和Illumina短读长测序技术,通过GALOP流程进行基因组组装,包括NextDenovo初步组装、Medaka和Hapo-G多轮抛光、以及Ragtag支架;从花蕾、叶、根和茎四个器官提取RNA进行转录组测序,采用Gmove证据驱动方法进行基因预测;使用RGAugury管道预测抗病基因类似物,并通过OrthoFinder进行正交群分析鉴定特有RGAs;利用LTR组装指数(LAI)评估基因组质量,并通过BUSCO评估基因完整性。所有植物材料均来源于法国BraCySol生物资源中心。
研究人员成功获得了五个品种的高质量基因组组装。甘蓝品种的基因组大小在563-646 Mb之间,白菜品种在373-404 Mb之间,其中91.9%至98.7%的序列被锚定到伪染色体上。与先前发布的版本相比,新组装的基因组在完整性和连续性方面均有显著提升。
以白菜R500品种为例,新组装版本相比之前版本在高度重复的着丝粒周围区域和A01染色体起始区域有显著改进。通过LTR组装指数(LAI)评估,所有新基因组的LAI值均超过10,符合参考基因组质量标准。BUSCO分析显示基因完整性达到99.3%至99.4%,证明了组装的高质量。
利用多器官RNA-Seq数据,研究团队预测了52,275至71,867个蛋白质编码基因,其中94.97%至99.49%位于伪分子上。特别重要的是,通过RGAugury管道预测了1,382至1,912个抗病基因类似物,涵盖了NLR(nucleotide-binding site leucine-rich repeat receptors)、RLK(receptor-like kinase)等多个类别。
与同一形态型的其他品种或先前版本相比,新组装的基因组中鉴定出了大量特有的抗病基因类似物。例如,在甘蓝品种Nd125、Bos01和C102中至少发现了122个新的RGAs,而在白菜品种Wutacai和R500中则分别发现了超过200个新的RGAs。这些特有的RGAs不均匀地分布在基因组中,如在R500品种中,新发现的RGAs在所有染色体上均有分布,但在A01染色体起始区域存在明显富集。
除了核基因组,研究还组装了五个品种的叶绿体基因组,大小在153,036至153,464 bp之间。通过FastPlast组装、GeSeq注释和OGDRAW可视化,获得了完整的叶绿体基因组图谱,为后续比较基因组学研究提供了基础。
这项研究通过对五个芸薹属品种的染色体水平基因组组装,极大地扩展了我们对这些重要作物遗传多样性的认识。新组装的基因组不仅质量更高、连续性更好,而且注释出了大量新的基因,特别是抗病基因类似物。这些特有RGAs的发现为芸薹属作物抗病育种提供了宝贵的基因资源,有望通过基因导入策略增强甘蓝型油菜等作物对主要病害的抗性。
这些高质量的基因组资源为未来芸薹属作物的功能基因组学研究、比较基因组学分析和分子育种实践奠定了坚实基础。通过深入挖掘这些基因组中蕴藏的遗传变异,特别是抗病相关基因的多样性,将有助于培育具有广谱和持久抗病性的新品种,应对当前农业生产中面临的病害挑战。该研究展示了对作物野生近缘种和地方品种进行系统基因组学分析的价值,为其他作物的遗传资源挖掘提供了可借鉴的研究范式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号