
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DaapNLRSeek:多倍体甘蔗基因组抗病基因预测与进化的创新工具
【字体: 大 中 小 】 时间:2025年06月25日 来源:iScience 4.6
编辑推荐:
为解决多倍体甘蔗基因组中NLR(核苷酸结合位点-富含亮氨酸重复序列)抗病基因注释难题,中国科学院微生物研究所团队开发了DaapNLRSeek流程,准确预测了5个甘蔗品种的NLR基因,发现其扩张发生在多倍化之前,并鉴定出可诱导烟草过敏反应(HR)的成对NLR基因。该研究为甘蔗抗病育种提供了重要工具,发表于《iScience》。
甘蔗是全球最重要的糖料和生物能源作物之一,但病原体导致的产量损失高达20-50%。面对这一严峻挑战,抗病育种成为关键,而植物抗病基因的核心——NLR(Nucleotide-binding Leucine-rich Repeat)基因的精准注释是基础。然而,甘蔗基因组高度多倍化(如栽培种R570染色体数2n≈114),传统注释工具难以准确识别其复杂的NLR基因家族。
为突破这一瓶颈,中国科学院微生物研究所的Yiting Huang、Yingfeng Luo和Xiao Lin团队开发了DaapNLRSeek(二倍体辅助的多倍体NLR注释流程)。该研究以甘蔗的二倍体近缘种高粱(Sorghum bicolor)和滇蔗茅(Erianthus rufipilus)的NLR基因为训练集,结合NLR-Annotator、GeMoMa和Augustus算法,首次实现了多倍体甘蔗NLR基因的高精度预测。研究分析了5个甘蔗品种(包括栽培种R570、ZZ1和野生种AP85-441)的NLR基因,发现其扩张事件早于多倍化过程,并鉴定出能激活烟草(Nicotiana benthamiana)过敏反应的成对NLR基因。
关键技术方法包括:1)基于二倍体近缘种手动注释构建训练集;2)提取NLR基因座及其侧翼35 kb序列构建“NLRome”;3)整合同源预测与从头预测结果;4)通过瞬时表达实验验证候选基因功能。样本来源于已发表的甘蔗基因组数据及栽培品种“桂糖42”。
研究结果:
DaapNLRSeek流程的优越性
相比自动注释流程,DaapNLRSeek在R570中多检出26%的NLR基因(3,362 vs 2,428),且94%的预测结果与NLR-Annotator标记位点一致。在复杂多倍体基因组ZZ1(10.38 Gb)中,检出7,138个NLR基因,是自动注释的1.9倍。
NLR基因的进化特征
系统发育分析显示,甘蔗NLR基因的扩张主要发生在多倍化之前。例如,高粱单拷贝位点在滇蔗茅中已扩增至7个拷贝,而甘蔗各单倍型保留了相似拷贝数。染色体水平分析发现NLR基因分布不均,如R570的10号同源染色体间NLR数量差异达76个(10A含169个,10E仅93个)。
成对NLR基因的新发现
突破传统“15 kb间距”标准,发现间距达103 kb的成对NLR基因仍保持头对头排列。从栽培种“桂糖42”中克隆的G9-1/G14-2(含蛋白激酶结构域)能独立诱导烟草HR反应,系统发育显示其分别与水稻RGA4/RGA5同源,但序列相似性<40%,代表新的成对抗病基因家族。
非典型抗病基因的鉴定
首次在甘蔗中发现TIR-only(仅含TIR结构域)和TPK(串联蛋白激酶)基因。虽然R570含15个TIR-only和129个TPK基因,但瞬时表达未引发HR,提示其可能通过其他途径参与免疫。
结论与意义:
该研究创建的DaapNLRSeek工具解决了多倍体作物NLR基因注释的全球性难题,为甘蔗抗病育种提供了基因组资源。发现成对NLR基因的功能保守性及结构多样性,为工程化抗病设计提供了新靶点。研究还揭示了多倍化前后NLR基因的进化规律,对理解植物基因组复杂性具有重要理论价值。论文中鉴定的G9-1/G14-2等候选基因,为后续解析甘蔗免疫机制奠定了基础。


生物通微信公众号
知名企业招聘