基于机器学习的罗布麻形态性状预测与基因型-播期优化研究

【字体: 时间:2025年08月10日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对罗布麻(Hibiscus sabdariffa L.)生产中基因型与环境互作(G×E)的复杂非线性关系,创新性地将随机森林(RF)和多层感知器(MLP)算法与NSGA-II多目标优化相结合,成功构建了关键形态性状(分枝数、生育期、蒴果数和单株种子数)的预测模型。结果表明RF模型(R2=0.84)优于MLP,通过特征重要性分析发现播期比基因型对性状变异影响更大,最终确定Qaleganj基因型配合5月5日播种可实现最优性状组合。该研究为作物智能育种和精准栽培提供了新范式。

  

在热带作物生产中,罗布麻因其富含花青素、维生素C和高价值种子蛋白备受关注,但传统育种面临基因型与环境互作效应难以量化、最优栽培方案筛选效率低下等瓶颈。 Shiraz University(伊朗设拉子大学)的研究团队创新性地将人工智能引入这一领域,通过整合机器学习与进化算法,在《Scientific Reports》发表了突破性研究成果。

研究团队设计了三阶段技术路线:首先通过田间试验获取10个基因型×5个播期的表型数据;随后采用RF和MLP算法建模,其中RF通过50棵最大深度为5的决策树构建集成模型,MLP则采用双隐藏层(5,5)的神经网络架构;最终通过NSGA-II算法进行多目标优化。特征重要性分析采用排列置换法重复50次,模型评估包含R2、RMSE等4项指标。

模型性能评估

RF模型在测试集上对分枝数、生育期等性状的R2达0.84-0.96,显著优于MLP。如图3所示,预测值与实测值的散点紧密分布在回归线两侧,其中生育期预测误差仅6.72天(RMSE)。

特征重要性分析

图4显示播期对性状变异的贡献度达基因型的2-3倍,5月播种的特征重要性得分最高(0.15-0.20)。基因型中Iranshahr对分枝数、Qaleganj对蒴果数的预测贡献突出,但种子产量的特征重要性均为负值,暗示其受未测量因素主导。

多目标优化结果

如表3所示,NSGA-II筛选的Pareto最优解表明:Qaleganj基因型配合5月5日播种可实现分枝数26.0个、生育期176天、蒴果数116.1个和单株种子1517粒的均衡优化。该方案比传统7月播种的产量提升23%,同时缩短生育期12天。

这项研究开创了作物智能育种的创新范式:通过RF-NSGA-II框架首次量化了罗布麻G×E互作的非线性规律,证明中期播种(5月)能最优平衡光温资源利用与产量形成。特征重要性分析揭示的"播期主导"规律为全球变暖背景下的栽培制度调整提供了理论依据,而负重要性特征则提示未来需整合生理指标完善模型。该方法的预测精度(R2>0.8)显著优于传统线性模型,可扩展应用于其他作物的数字化育种系统。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号