基于机器学习的向日葵列当抗性基因鉴定与分类模型构建研究

【字体: 时间:2025年05月17日 来源:Plant Methods 4.7

编辑推荐:

  本研究针对向日葵列当(Orobanche cumana)寄生危害导致的经济损失问题,通过整合转录组学和代谢组学数据,运用LASSO回归和随机森林特征选择方法筛选出24个关键抗性基因,并构建了AUC达0.9865的SVM分类模型。该研究为抗性品种选育提供了新型生物标志物,揭示了JA信号通路在抗性机制中的潜在作用,为作物抗寄生育种提供了机器学习辅助决策的新范式。

  

向日葵作为全球重要的油料作物,正面临列当寄生的严峻威胁。这种全寄生植物通过吸器连接向日葵根系维管组织,掠夺水分和养分,导致宿主生长受阻甚至死亡,造成严重产量损失。传统防治方法如生物防治和化学控制效果有限,培育抗性品种被视为最有效的解决方案。然而,列当种群快速进化和遗传多样性导致新毒性小种不断出现,亟需持续发现新的抗性基因。在此背景下,内蒙古大学联合内蒙古农牧业科学院的研究团队创新性地将机器学习引入抗性育种研究,相关成果发表在《Plant Methods》。

研究采用转录组测序(103个品种)、代谢组分析(5个代表性品种)和机器学习算法相结合的策略。关键技术包括:基于HISAT2的转录组比对、edgeR差异表达分析、WGCNA共表达网络构建、LASSO特征选择、四种机器学习模型(SVM/KNN/LR/GaussianNB)的LOOCV验证,以及LC-MS/MS代谢物检测。

研究结果部分:
"表型与共表达网络分析"显示,感病品种的鲜重、干重和株高显著降低。WGCNA鉴定出与抗性显著相关的棕色模块(r=0.34),该模块与差异表达基因的交集发现质膜(GO:0005886)和昼夜节律(KEGG:han04712)通路富集。

"机器学习模型构建"中,LASSO筛选的24个基因包含锌指蛋白LOC110899186、UDP-糖基转移酶LOC110912127等已知抗逆相关基因。SVM模型表现最优,测试集准确率达0.9514,AUC值0.9865。随机森林选出的TOP10基因中,LOC110876215表达量与抗性概率呈正相关。

"代谢关联分析"通过PCA(PC1=32.98%)发现692个差异代谢物,网络分析显示LOC110915330等基因与茉莉酸(JA)显著正相关,暗示JA信号可能参与抗列当机制。

结论部分指出,该研究首次建立基于转录组特征的向日葵抗列当分类模型,突破传统育种依赖表型鉴定的局限。发现的抗性基因标记可用于早期品种筛选,避免耗时费力的田间胁迫实验。特别值得注意的是,LOC110878962(CYP82D47)等细胞色素P450基因的鉴定为抗性机制研究提供新方向,而JA相关代谢物的发现则与植物应对生物胁迫的已知机制相吻合。研究团队建议未来可扩大样本量验证模型泛化能力,并深入探究JA信号与抗性基因的调控关系。这项研究为作物抗寄生育种提供了"基因标记+算法模型"的双重工具,对实现精准农业具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号