基于机器学习的大麦白粉病抗性预测:整合农艺性状与分子标记的创新研究

【字体: 时间:2025年06月05日 来源:Scientific Reports 3.8

编辑推荐:

  针对大麦白粉病抗性预测的育种难题,伊朗Gonbad Kavous大学团队通过整合农艺性状与分子标记数据,系统评估了决策树(DT)、随机森林(RF)、神经网络(NET)和高斯过程回归(GPR)等机器学习模型。研究发现神经网络结合RReliefF/MRMR特征选择算法表现最优(测试集R2 达0.9964),揭示了穗芒长度(AWL)、穗柄重(PEDW)等关键抗性相关性状。该研究为作物抗病育种提供了智能化解决方案。

  

大麦白粉病是由Blumeria graminis f.sp. hordei引起的毁灭性病害,每年造成全球大麦产量显著损失。传统育种方法依赖耗时费力的表型筛选,而分子标记虽能辅助选择,却无法直接定位抗性基因。随着病原菌小种快速变异和气候变化加剧,开发高效精准的抗性预测技术成为育种领域的迫切需求。伊朗戈勒斯坦省Gonbad Kavous大学的研究团队创新性地将机器学习(ML)与多组学数据结合,通过系统评估不同算法在抗性预测中的表现,为智能育种提供了新范式,相关成果发表于《Scientific Reports》。

研究团队采用130个F8
-F9
大麦群体(亲本为Badia和Kavir),在三个播种期(2018-2020年)进行田间试验,收集了15项农艺性状(如株高PHI、穗芒长AWL)和790个分子标记(SSR、RAPD等)数据。通过五种交叉验证和贝叶斯优化,比较了四种ML模型(DT、RF、NET、GPR)与三种特征选择算法(F-test、MRMR、RReliefF)的组合效果,采用MAE、RMSE和R2
等指标评估预测性能。

【Results】
性状相关性分析显示,穗芒长(AWL,r=-0.991)和穗柄重(PEDW,r=-0.993)与病情指数(AUDPC)呈强负相关,暗示这些性状可作为抗性间接指标。特征选择算法筛选出20个核心分子标记(如JJS1-B、HvSMEh288)和10个关键农艺性状(如旗叶面积FLA、穗粒数GRN)。

【Genotypic features】
泰勒图显示,NET模型在基因型数据预测中表现最优,测试集R2
达0.975(MRMR特征选择)。RF模型次之,而DT和GPR存在明显过拟合(训练/测试集R2
差值>0.3)。

【Phenotypic features】
表型数据预测中,NET保持领先(R2
=0.994),且特征选择算法影响较小。MRMR筛选的性状组合(如株高PHI、生物量BIO)具有最佳泛化能力。

【Phenotypic and genotypic features】
多组学整合使NET预测性能进一步提升(测试集R2
达0.9964),显著优于单一数据类型(p<0.0001)。Friedman检验证实NET-MRMR组合在MAE、RMSE指标上具有统计学优势。

【Discussion】
该研究首次系统评估了ML模型在大麦白粉病多组学数据预测中的表现,揭示神经网络捕捉非线性关系的能力使其特别适合抗性预测。特征选择算法的重要性得到验证——MRMR和RReliefF通过最小化冗余特征,将预测误差降低18.7%。尽管存在轻微过拟合(训练/测试集性能差距约5%),但通过正则化和扩大样本量可进一步优化。研究提出的智能预测框架,将传统育种周期从5-8年缩短至1-2个生长季,为应对病原菌快速进化提供了新工具。

结论强调,整合农艺性状与分子标记的ML模型能准确预测大麦白粉病抗性,其中NET-MRMR组合为最优方案。该技术可推广至其他作物病害研究,推动育种进入"预测-验证"的精准时代。未来需在更广泛基因型和环境中验证模型泛化能力,并探索与遥感、基因组选择的协同应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号