
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的罗布麻形态性状预测与基因型-播期优化研究
【字体: 大 中 小 】 时间:2025年08月10日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对罗布麻(Hibiscus sabdariffa L.)生产中基因型与环境互作(G×E)的复杂非线性关系,创新性地将随机森林(RF)和多层感知器(MLP)算法与NSGA-II多目标优化相结合,成功构建了关键形态性状(分枝数、生育期、蒴果数和单株种子数)的预测模型。结果表明RF模型(R2=0.84)优于MLP,通过特征重要性分析发现播期比基因型对性状变异影响更大,最终确定Qaleganj基因型配合5月5日播种可实现最优性状组合。该研究为作物智能育种和精准栽培提供了新范式。
在热带作物生产中,罗布麻因其富含花青素、维生素C和高价值种子蛋白备受关注,但传统育种面临基因型与环境互作效应难以量化、最优栽培方案筛选效率低下等瓶颈。 Shiraz University(伊朗设拉子大学)的研究团队创新性地将人工智能引入这一领域,通过整合机器学习与进化算法,在《Scientific Reports》发表了突破性研究成果。
研究团队设计了三阶段技术路线:首先通过田间试验获取10个基因型×5个播期的表型数据;随后采用RF和MLP算法建模,其中RF通过50棵最大深度为5的决策树构建集成模型,MLP则采用双隐藏层(5,5)的神经网络架构;最终通过NSGA-II算法进行多目标优化。特征重要性分析采用排列置换法重复50次,模型评估包含R2、RMSE等4项指标。
模型性能评估
RF模型在测试集上对分枝数、生育期等性状的R2达0.84-0.96,显著优于MLP。如图3所示,预测值与实测值的散点紧密分布在回归线两侧,其中生育期预测误差仅6.72天(RMSE)。
特征重要性分析
图4显示播期对性状变异的贡献度达基因型的2-3倍,5月播种的特征重要性得分最高(0.15-0.20)。基因型中Iranshahr对分枝数、Qaleganj对蒴果数的预测贡献突出,但种子产量的特征重要性均为负值,暗示其受未测量因素主导。
多目标优化结果
如表3所示,NSGA-II筛选的Pareto最优解表明:Qaleganj基因型配合5月5日播种可实现分枝数26.0个、生育期176天、蒴果数116.1个和单株种子1517粒的均衡优化。该方案比传统7月播种的产量提升23%,同时缩短生育期12天。
这项研究开创了作物智能育种的创新范式:通过RF-NSGA-II框架首次量化了罗布麻G×E互作的非线性规律,证明中期播种(5月)能最优平衡光温资源利用与产量形成。特征重要性分析揭示的"播期主导"规律为全球变暖背景下的栽培制度调整提供了理论依据,而负重要性特征则提示未来需整合生理指标完善模型。该方法的预测精度(R2>0.8)显著优于传统线性模型,可扩展应用于其他作物的数字化育种系统。
生物通微信公众号
知名企业招聘