DeepSpecN:结合PROSPECT-PRO与Conv-Transformer的叶片氮含量高光谱估测新方法

【字体: 时间:2025年10月11日 来源:Plant Phenomics 6.4

编辑推荐:

  本研究针对叶片氮含量(LNC)无损估测中传统方法依赖原位数据、物理模型存在反演不适定、混合方法受域偏移限制等问题,提出了一种新型混合方法DeepSpecN。该方法创新性地融合连续小波变换(CWT)、PROSPECT-PRO模型、改进的Transformer架构及光谱相似性样本选择策略,仅利用模拟数据训练即可实现多作物LNC高精度估测(玉米RMSE=0.247 g/m2, R2=0.665),显著提升了模型的泛化能力和实用性,为精准农业氮素管理提供了新范式。

  
氮素是植物生长发育不可或缺的关键元素,它不仅是蛋白质、核酸和叶绿素的重要组成成分,更直接关系到植物的光合作用效率、细胞分裂能力以及整体生长状况。传统上,叶片氮含量(Leaf Nitrogen Content, LNC)的测定依赖于实验室化学分析,这种方法虽然准确,但耗时费力、成本高昂,且会破坏样品,难以满足现代农业对作物生长进行快速、无损、大面积监测的需求。随着遥感技术的发展,高光谱测量为LNC的无损估测提供了可能。然而,现有的估测方法各有局限:经验方法(如植被指数VI和机器学习模型)严重依赖大量原位数据进行训练,模型稳健性和跨环境迁移能力较差;基于辐射传输模型(如PROSPECT)的物理方法虽然具有更好的机理性和普适性,但其反演过程存在不适定性问题,即不同的叶片性状组合可能产生相似的光谱反射率,导致估测结果不唯一;混合方法试图结合物理模型和经验模型的优点,利用物理模型生成大量模拟数据来训练统计或机器学习模型,但模拟数据与实测数据之间的分布差异——即“域偏移”(Domain Shift)问题——严重制约了模型在真实场景下的应用效果。特别是在叶片尺度上,使用叶片接触式探头测量的双向反射率因子(Bidirectional Reflectance Factor, BRF)光谱与PROSPECT模型模拟所需的半球-方向反射率因子(Directional-Hemispherical Reflectance Factor, DHRF)光谱之间存在显著差异,其主要原因之一是叶片表面的镜面反射(Specular Reflection)。此外,如何从海量的模拟数据中筛选出对目标域(实测数据)最具代表性的训练样本,以及如何利用先进的深度学习模型充分挖掘高光谱数据中隐藏的复杂特征,都是当前LNC估测研究面临的挑战。
为了突破这些瓶颈,由慕尼黑工业大学(Technical University of Munich)Shuai Yang、Kang Yu等人组成的研究团队在《Plant Phenomics》上发表了一项研究,提出了一种名为DeepSpecN的新型混合方法。该方法旨在不依赖任何原位训练数据的情况下,通过整合物理模型与深度学习技术,实现对玉米、小麦、水稻和高粱四种作物LNC的准确、稳健估测。
研究人员为开展此项研究,主要运用了几项关键技术:首先,利用PROSPECT-PRO模型生成了包含20万组模拟数据的大型查找表(Look-Up Table, LUT),模拟了叶片生化参数(如叶绿素、蛋白质含量)及其对应的DHRF光谱。其次,收集了1724个玉米叶片样本的高光谱BRF数据(使用FieldSpec4光谱仪测量)及对应的LNC(通过实验室化学分析获得)。关键的创新技术包括:1)采用连续小波变换(CWT)等多种光谱变换方法以减少镜面反射的影响;2)提出了一种基于光谱相似性的样本选择方法,从海量模拟数据中为每个实测光谱筛选出最相似的100个模拟样本,构建更具代表性的训练集(T100数据集);3)设计了一种结合一维卷积神经网络(1D-CNN)和Transformer架构的深度学习模型(Conv-Transformer),用于从高光谱数据中自动提取局部和全局特征。研究还广泛比较了物理反演、植被指数回归以及多种机器学习和深度学习模型(如LSTM、LGBM、SVR、Lasso)的性能。
3.1. 光谱变换后的光谱图示
研究发现,原始模拟DHRF光谱的振幅普遍高于实测BRF光谱,尤其在可见光-近红外(VNIR)区域差异显著(可达38.19%)。经过CWT和FD(一阶导数)等光谱变换处理后,模拟光谱与实测光谱的平均线更为接近,一些吸收特征得到增强,这有助于缓解域偏移问题,为后续模型训练奠定了良好基础。
3.2. 基于高光谱植被指数的参数回归方法性能
研究评估了30种植被指数结合线性回归模型的估测性能。当使用基于叶绿素含量的氮分配模型计算LNC时,GARI、GNDVI、GRVI和CI800,550等指数表现出相对较高的估测精度(R2最高为0.477)。而当使用基于蛋白质含量的蛋白质-氮转化模型时,所有植被指数的估测精度均非常低(MAPE > 75%)。更重要的是,当模型参数在更具代表性的T100数据集上拟合后,多数植被指数的估测性能得到提升,例如SR708,775的R2达到了0.494,这表明训练样本的质量和代表性比单纯的数量更重要。
3.3. 基于非参数回归的混合方法性能
在利用全部20万模拟数据训练的情况下,深度学习模型普遍优于传统机器学习模型。其中,本研究提出的Conv-Transformer模型结合氮分配模型取得了最佳估测精度(RMSE=0.265 g/m2, R2=0.614)。与五种物理反演方法相比,混合方法的性能略胜一筹,最优的物理方法PROCWT-S5的R2为0.603。当引入基于光谱相似性的样本选择策略,使用T100数据集进行训练后,模型的性能得到显著提升。Conv-Transformer模型在T100-PROCWT-S4数据集上达到了所有方法中的最高精度(RMSE=0.247 g/m2, R2=0.665)。相比之下,LSTM模型表现不佳,而LGBM、SVR和Lasso等模型在T100数据集上的性能也有明显改善,这充分证明了样本选择策略的有效性。
3.4. DeepSpecN在不同作物中的验证
为了评估DeepSpecN各组成部分的贡献,研究进行了消融实验。结果表明,Conv-Transformer架构的改进(相比ETransformer)和样本选择策略的采用均能独立提升模型性能,而两者结合则产生协同效应,显著提高了LNC估测精度。DeepSpecN在玉米、小麦、水稻和高粱四种作物上均表现出良好的预测能力和泛化性,验证了该方法的普适性。
研究结论与意义
本研究成功开发了DeepSpecN这一新型混合框架,用于叶片氮含量的高光谱估测。其主要结论和重要意义在于:
  1. 1.
    方法创新与性能优越性:DeepSpecN通过整合CWT降噪、PROSPECT-PRO物理约束、改进的Conv-Transformer特征学习以及光谱相似性样本选择策略,有效解决了镜面反射和域偏移等关键难题。在仅使用模拟数据训练的情况下,其对玉米LNC的估测精度超越了传统的物理反演方法、基于植被指数的参数回归方法以及其他非参数回归的混合方法,证明了该方法的先进性和有效性。
  2. 2.
    样本选择策略的关键作用:研究强调,并非所有模拟样本都对模型训练有积极贡献。基于光谱相似性的样本选择方法能够筛选出与目标域(实测数据)分布更接近的模拟样本,有效缩小了模拟数据与实测数据之间的分布差异,从而显著提升了模型在真实数据上的泛化能力。这一策略为解决混合方法中的域偏移问题提供了切实可行的思路。
  3. 3.
    LNC计算模型的影响:研究发现,基于叶绿素含量的氮分配模型比基于蛋白质含量的蛋白质-氮转化模型能获得更准确的LNC估测结果。这表明在利用PROSPECT-PRO进行LNC间接估测时,选择合适的代理变量和转换公式至关重要,同时也提示需要对不同作物进行特定的模型校准。
  4. 4.
    强大的泛化能力:DeepSpecN在玉米、小麦、水稻和高粱四种作物上的成功验证,表明该方法具有较强的跨物种适应性,为大规模作物氮素监测提供了可靠的技术支撑。
  5. 5.
    研究局限与未来方向:尽管DeepSpecN取得了显著成果,但其性能仍依赖于PROSPECT-PRO模型参数设置的合理性以及LNC计算模型的准确性。未来研究需要收集更多作物和环境下的大样本数据来优化模型,并探索该方法在冠层尺度氮素估测以及多性状同时反演中的应用潜力。
总之,DeepSpecN展示了将物理模型约束、智能样本选择和深度学习相结合的巨大潜力,为发展不依赖原位数据、高精度、强泛化能力的作物氮素无损监测技术开辟了新途径,对推动精准农业的发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号