基于反射光谱的PLSR模型可转移性解析提升叶片性状估算精度研究

《Plant Phenomics》:Boosting leaf trait estimation from reflectance spectra by elucidating the transferability of PLSR models

【字体: 时间:2025年06月16日 来源:Plant Phenomics 7.6

编辑推荐:

  针对叶片光谱-PLSR模型跨站点可转移性不明的关键问题,研究人员通过采集中国8个森林站点349树种1967份样本的6大叶片性状(LMA/LWC/EWT/C/N/P)及反射光谱数据,系统评估了模型跨站点预测性能。发现物种进化历史和气候差异是限制模型迁移的主因,而整合多站点训练数据可构建通用PLSR模型,为建立全球叶片性状光谱数据库提供方法论支撑。

  

植物叶片性状是理解生态系统功能的核心指标,传统测量方法依赖耗时费力的实验室分析,制约了大尺度性状数据库的构建。光谱技术虽能快速无损获取叶片反射光谱数据,但基于偏最小二乘回归(PLSR)的预测模型在跨站点应用时存在显著性能衰减,其可转移性机制尚不明确。这一瓶颈严重限制了光谱技术在植物功能生态学中的规模化应用。

为破解这一难题,中国科学院植物研究所等单位的研究人员联合开展了跨气候带的多站点研究。团队在中国8个森林站点(纬度跨度20°)采集了349个树种1967份样本,测定6个关键叶片性状:比叶面积(LMA, leaf mass per area)、叶片含水量(LWC)、等效水厚度(EWT)、以及碳(C)、氮(N)、磷(P)的质量分数。配套获取500-2200 nm高分辨率反射光谱数据,通过系统比较站点特异性PLSR模型的跨站点预测性能,首次揭示了模型可转移性的关键制约因素。该成果发表于《Plant Phenomics》期刊。

研究采用三大关键技术:① FieldSpec 4高光谱仪标准化采集叶片反射光谱;② 基于Jackknife重采样和10折交叉验证构建稳健PLSR模型;③ 结合系统发育树(V.PhyloMaker2生成)和气候因子量化进化历史(加权UniFrac距离)与环境差异(年均温MAT/年降水MAP)的影响。

【3.1 跨站点模型可转移性】结果显示,站点特异性PLSR模型在异源站点预测时普遍存在显著性能下降(P<0.05)。其中营养性状(C/N/P)的nRMSE增幅最大(7.92-13.61%),而结构性状(LWC/LMA/EWT)降幅较小(4.74-5.73%)。值得注意的是,物种多样性高的站点(如西双版纳)模型迁移性优于单一物种站点。

【3.2 影响因素解析】线性混合效应模型表明:物种进化历史差异(加权UniFrac距离)对LWC/LMA预测的影响最大(P<0.001),而环境温差(ΔMAT)主导C/N/P的模型迁移(P<0.05)。与传统认知不同,性状分布差异(Hellinger距离)的影响相对较弱。随机森林分析进一步确认,ΔMAT对多数性状模型迁移的贡献度超过40%。

【3.3 通用模型构建】通过整合多站点训练数据,开发的跨站点PLSR模型展现出与站点特异性模型相当的预测精度(R2
=0.53-0.83)。特别是LMA预测达到最优水平(nRMSE=7.77%),且模型稳定性高(标准差<0.4%)。当训练站点从1个增至6个时,所有性状的nRMSE平均降低3.34%。

这项研究从方法论层面解决了光谱模型"水土不服"的难题。其创新性体现在:① 首次量化了进化历史对"性状-光谱"关系的塑造作用,解释了近缘物种模型迁移性更好的现象;② 揭示了环境梯度通过改变性状共变网络间接影响模型性能的机制,特别是对缺乏直接光谱特征的营养性状预测;③ 提出的"多样性增强"训练策略,为构建全球通用叶片性状预测模型提供了实践路径。研究团队呼吁建立开放的叶片光谱数据库,这将推动植物表型组学从单点研究向网络化研究范式转变。未来需在针叶林、极端环境植被等更广谱的功能型中验证模型普适性,并探索季节动态对模型稳定性的影响。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号