基于机器学习方法的蚕豆春秋两季种植品种性能评估研究
《Smart Agricultural Technology》:Integrating Machine Learning Approaches to Evaluate Faba Bean Varietal Performance under Fall and Spring Plantings
【字体:
大
中
小
】
时间:2025年10月26日
来源:Smart Agricultural Technology 5.7
编辑推荐:
本研究针对传统作物模型难以捕捉复杂非线性关系的瓶颈问题,研究人员创新性地整合五种特征选择方法与多种机器学习算法,系统评估了22个蚕豆品种在春秋两季种植条件下的产量表现。结果表明,线性回归模型在春季产量预测中表现最优(CC 0.95-0.98),而随机森林在秋季产量分类中准确率最高(91.9%)。该研究为作物表型组学与精准农业提供了可靠的计算生物学范式,对实现可持续豆类生产具有重要实践意义。
在全球气候变化和粮食安全挑战日益严峻的背景下,作物生产系统面临着单一连作导致的病虫害加剧、土壤退化等突出问题。传统作物轮作模式因经济效益有限而难以推广,农民甚至不得不采取休耕方式维持土地生产力。蚕豆(Vicia faba L.)作为第四大全球豆类作物,因其固氮能力、营养价值高(蛋白质26.1%,碳水化合物58.3%)和生态效益而成为作物轮作体系的理想选择。然而,在弗吉尼亚州亚热带气候条件下,春秋两季种植时机的选择成为影响产量的关键因素——春季早播易受霜冻降雨制约,晚播则面临高温胁迫;秋季播种则需平衡霜前定植与越冬风险的矛盾。传统经验模型难以准确预测复杂环境条件下的产量表现,亟需开发新的决策支持工具。
为破解这一难题,弗吉尼亚州立大学的Shahram Torabian和Salar Farhangi-Abriz在《Smart Agricultural Technology》发表研究,首次系统整合多种机器学习(ML)方法评估蚕豆品种在春秋两季的表现。研究人员通过2013-2025年在Randolph农场开展的田间试验,收集了22个蚕豆品种(包括EN45、EN47、Karmazyn等)在多个播种期下的农艺性状数据。研究采用五种特征选择方法(包括相关性特征子集选择、主成分属性变换等)结合三种回归算法(线性回归、随机森林、多层感知器)进行产量预测,并运用两种分类算法(逻辑回归、随机森林)将产量划分为低、中、高、特级四个等级。所有分析均采用10折交叉验证和留一品种交叉验证(LOVO)确保模型稳健性。
线性回归在春季产量预测中表现卓越,相关性系数(CC)达0.95-0.98,平均绝对误差(MAE)低至1.01 g/株。相关性属性评估器方法筛选出的荚果重量、单株种子数等特征最具预测力,表明春季产量主要受线性可解释的生理性状支配。
逻辑回归以79.5%的准确率略优于随机森林(77.2%),但对高产量等级识别能力有限。根冠比、单株荚果数等特征在分类中起决定性作用,反映出春季产量形成中资源分配策略的重要性。
线性回归与多层感知器(MLP)均表现出色(CC 0.84-0.99),ReliefF特征选择方法鉴定的荚果重量、地上部干重等性状成为关键预测因子。MLP在捕捉秋季复杂性状互作方面展现优势,暗示非线性的基因型-环境互作机制。
随机森林以91.9%的准确率显著优于逻辑回归,对所有产量等级均保持高判别力(F值0.83-0.94)。根系干重等地下部性状的重要性凸显,表明秋季长生育期下根系架构对产量稳定的关键作用。
LOVO验证表明线性回归对春季新品种预测误差(RMSE)最低达0.62 g/株,而秋季品种中MLP与线性回归互补优势明显。季节特异性模型的必要性得到证实,环境异质性限制了跨季节模型的通用性。
研究揭示季节间生理机制差异:春季产量更多受地上部性状的线性调控,而秋季则涉及根系与生殖性状的复杂互作。这种差异直接决定了不同机器学习算法在各季节的适用性。
讨论部分深入解析了关键性状的生理意义:荚果重量作为生殖库强度的指标,单株种子数反映繁殖潜力,地上部干重体现冠层光合能力,而根冠比则平衡地下部资源获取与地上部生长需求。特征选择方法通过过滤冗余变量显著提升模型性能,其中相关性属性评估器和ReliefF方法因兼顾生理相关性和低共线性而效果最佳。研究创新性地证明:对于线性主导的性状关系,线性回归即可实现优异预测;而当存在复杂非线性的基因型-环境互作时,MLP和随机森林等算法更具优势。
该研究的实践意义在于建立了作物表型组学与机器学习融合的分析范式,为育种家提供了品种适应性评价新工具。通过识别季节特异性的关键性状,为定向改良提供了靶点(如春季注重荚果发育,秋季关注根系构建)。研究方法可扩展至其他作物体系,特别是针对复杂环境互作下的产量预测难题。未来整合高通量表型技术(如无人机遥感)将进一步提升效率,实现从传统农艺测量向数字化智能决策的跨越。
最终结论强调:机器学习辅助的作物评价体系不仅能提高预测准确性,更能揭示不同生态条件下产量形成的生理基础。这种计算生物学方法与作物生理学的深度结合,为应对气候变化下的粮食安全挑战提供了新思路,推动农业向智慧化、可持续化方向发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号