基于交互特征增强深度神经网络预测玉米种子产量:揭示农业生态生理关系
《Discover Agriculture》:Enhanced deep neural network with interaction features for corn seed yield prediction: uncovering agroecophysiological relationships
【字体:
大
中
小
】
时间:2025年11月06日
来源:Discover Agriculture
编辑推荐:
本研究针对传统线性模型难以捕捉农业生态生理因素间非线性交互关系的难题,开发了集成交互特征的增强深度神经网络(DNN)模型。该模型通过融合根系定殖率与叶绿素含量(RootColonization_SPAD1)等9个交互特征,在测试集上实现R2=0.483、RMSE=2.794 t/ha的预测精度,较基线DNN(R2=0.190)显著提升,揭示了丛枝菌根真菌(AMF)与光合作用协同机制等关键生理通路,为精准农业提供了创新建模范式。
在全球粮食安全面临严峻挑战的今天,玉米作为重要粮食作物,其产量提升至2050年需实现显著增长。然而,传统农业生产模式正遭遇生态环境恶化的制约,其中非生物胁迫对作物生理过程的复杂影响尚未被充分认知。尤为关键的是,丛枝菌根真菌(AMF)和植物根际促生菌(PGPR)等有益微生物虽被证实能通过促进养分吸收(特别是磷元素)增强作物抗逆性,但这些生物因子与植物生理性状(如光合作用速率、冠层温度)之间的协同机制仍如黑箱般难以量化。
这一认知缺口直接制约了精准农业的发展。现有产量预测模型多基于线性假设,无法捕捉生态生理因素间错综复杂的非线性交互作用。例如,AMF介导的磷吸收如何通过调节叶绿素含量影响光合效率?冠层温度变化与根系发育之间存在怎样的反馈机制?这些深层次的农业生态生理关系亟待新型分析工具予以揭示。
在此背景下,Mohsen Jahan团队在《Discover Agriculture》发表的研究开创性地将交互特征工程与深度神经网络(DNN)相结合,构建了玉米种子产量预测新范式。研究人员在伊朗马什哈德费尔道西大学试验站(半干旱气候区)开展了为期两个生长季的田间试验,系统收集了40个生态生理特征参数,涵盖光合作用参数(Pmax1、Pmax2、PmaxMean)、植物营养元素(%N plant、%P plant)、冠层温度(CanopyTemp_1-4)、叶绿素指数(SPAD_1-4)以及根系性状(特异性根长)等32个原始特征。更重要的是,团队基于农业生理学先验知识,创新性地构建了9个交互特征,如根系定殖率与SPAD1的交互项(RootColonization_SPAD1),用以量化AMF共生效应与光合能力的协同关系。
研究采用五层密集连接的DNN架构(128-64-32-16-8神经元),引入批标准化(BatchNormalization)和丢弃层(Dropout=0.2)对抗过拟合,通过早停法(patience=50)和动态学习率调整(ReduceLROnPlateau)优化训练过程。为保障结果可重现性,所有随机操作均固定随机种子为42。
在技术方法层面,本研究核心创新在于将机器学习与农业生理学深度融合。首先采用随机分割(random_state=42)将96个样本划分为训练集(70%)、验证集(15%)和测试集(15%),并通过标准化预处理消除量纲影响。其次构建增强DNN模型,利用交互特征捕捉非线性关系,采用灵敏度分析(首层权重均值法)评估特征重要性,并借助Shapiro-Wilk检验验证残差正态性。
4.1 模型性能
增强DNN在测试集上表现出显著优势:R2达到0.483,较基线模型(0.190)提升154%;均方根误差(RMSE)和平均绝对误差(MAE)分别降低26.1%(2.794 t/ha)和22.8%(2.118 t/ha)。这一结果证实交互特征有效提升了模型对产量形成机制的解释力。
4.2 特征重要性
灵敏度分析揭示前五大关键特征分别为:RootColonization_SPAD1(0.107616)、SPAD_2(0.105658)、茎粗(Stem Diameter, 0.104434)、CanopyTemp1_RootColonization(0.103475)和植株磷含量(%P plant, 0.103461)。交互特征占据主导地位的现象,从计算角度验证了AMF通过提升叶绿素含量促进光合作用的生理通路,以及冠层温度与根系共生协同调控产量的生态机制。
4.3 残差分析
残差点随机分布在零值线周围,Shapiro-Wilk检验p值=0.070,表明模型不存在系统偏差。损失函数曲线显示训练集与验证集损失同步收敛,学习率自适应下降策略有效避免了振荡。
研究的讨论部分深刻阐释了交互特征的农业生态学意义。RootColonization_SPAD1的重要性印证了AMF通过扩大根表吸收面积促进磷元素转运,进而提升叶片叶绿素含量(SPAD)的光合增效机制;而茎粗(Stem Diameter)作为关键结构性状,既反映了维管束系统同化产物的运输能力,也体现了植株抗倒伏的生理基础。这些发现与Bhupenchandra等关于AMF增强光合效率的研究相互印证,也为Khoso等提出的PGPR-植物互作理论提供了数据支撑。
尽管模型性能显著提升,作者也指出样本量(96个)和单一地理来源的局限性。未来将通过多地区联合试验纳入土壤水分、农艺措施等协变量,并探索卷积神经网络(CNN)等架构处理时空序列数据。特别值得关注的是,团队提出迁移学习策略——将本次训练的模型作为基础模型,利用公开数据集(如USDA-NASS)进行微调,可快速适配区域化应用,这为模型泛化提供了可行路径。
该研究通过交互特征工程成功破解了农业生态生理复杂关系的量化难题,使DNN模型不仅成为预测工具,更成为解析AMF-植物互作等黑箱机制的新探针。当精准农业迈向智慧决策时代,这种数据驱动与机理认知相融合的研究范式,将为构建可持续农业生产系统提供关键科学支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号