比较基于遥感的玉米常见锈病易感性表型分析的统计“表型预测”模型
《Plant Phenomics》:Comparing statistical ‘phenomic prediction’ models for remote-sensing-based phenotyping of maize susceptibility to common rust
【字体:
大
中
小
】
时间:2025年11月07日
来源:Plant Phenomics 6.4
编辑推荐:
本研究探讨表型预测在遥感遗传分析中的应用潜力,通过整合多光谱数据及植被指数构建综合预测模型,比较OLS、RR、LASSO、ANN和GBRT等方法在预测视觉评分及遗传信号中的效果。结果表明,基因组估计育种值(GEBVs)结合岭回归(RR)或人工神经网络(ANN)能最佳提升遗传信号纯化,而线性回归(OLS)在单一植被指数与综合数据模型中表现相当,过度拟合可通过正则化解决。
Johannes W.R. Martini|Osval A. Montesinos-Lopez|Jose Crossa|Rodomiro Ortiz
国际玉米小麦改良中心 – CIMMYT
摘要
我们研究了基于遥感的表型分析中表型预测(Phenomic Prediction, PP)在遗传学研究中的潜力。我们没有依赖单一的植被指数,而是综合利用所有可用数据来预测人工评估的视觉得分(Visual Score, VS)。其背后的理念是,当有一个训练有素的模型时,这些预测可能比使用特定的植被指数(Vegetation Index, VI)更能准确地评估疾病症状。为了评估表型预测方法,我们将预测的视觉得分应用于全基因组关联研究(Genome-Wide Association Study, GWAS),并分析检测到的遗传信号的强度和位置。我们使用了两组不同的预测变量:i) 多光谱相机和热成像相机捕获的五个基本波长(基本特征模型,Basic Traits Model, BT);ii) 所有特征(All Traits, AT),包括五个基本波长和十个植被指数。在统计方法方面,我们比较了 a) (线性)普通最小二乘回归(Ordinary Least Squares Regression, OLS),b) (线性)岭回归(Ridge Regression, RR),c) (线性)最小绝对值收缩与选择算法(Least Absolute Shrinkage and Selection Operator, LASSO),d) 人工神经网络(Artificial Neural Network, ANN)以及 e) 梯度提升回归树方法(Gradient Boosted Regression Tree, GBRT)。研究结果表明,仅基于五个基本波长的简单线性OLS回归(BT-OLS)的表现与最佳的单个植被指数相当。而在OLS回归中包含所有特征(AT-OLS)会导致过拟合现象,这一点通过AT-RR和AT-LASSO的正则化处理得到了避免。非线性的ANN方法似乎进一步改善了结果,但各方法之间的差异并不具有统计学意义。当使用不同特征的基因组估计育种值(Genomic Estimated Breeding Values, GEBVs)而非其调整后的表型时,遗传信号的纯化效果最为显著。在所有方法中,将GEBVs与岭回归或非线性ANN结合使用获得了最佳结果。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号