基于光学水体分类与1D CNN-Transformer特征提取的叶绿素a浓度反演方法
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:A Chlorophyll Concentration Inversion Method Based on OWTs and 1D CNN-Transformer Feature Extraction
【字体:
大
中
小
】
时间:2025年12月11日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本研究针对不同光学水体类型(OWT)下叶绿素a(Chla)浓度反演精度受限的难题,提出了一种结合光学水体分类、双流特征提取(1D CNN-Transformer)和多模型评估的创新反演框架OWT-CCINET。该方法首先通过k-means聚类将水体分为四类,针对每类优化特征提取策略并筛选最佳回归模型,显著提升了Chla反演精度(MAE=0.410, R2=0.899)及跨传感器适用性,为复杂水环境监测提供了可靠技术支撑。
海洋是地球的生命之源,而叶绿素a(Chla)作为浮游植物光合作用的关键色素,其浓度变化直接反映了海洋生态系统的健康状况。自从20世纪中期以来,科学家们通过船只和观测平台收集Chla数据,但受限于传感器差异和观测技术,难以实现大范围长期监测。随着卫星遥感技术的发展,全球尺度Chla浓度监测成为可能,但挑战也随之而来——不同水域的光学特性千差万别,从清澈的开阔大洋到浑浊的沿岸水域,其光谱特征如同人的指纹一样独特。这种多样性使得传统反演算法在跨区域应用时常常"水土不服"。
目前主流的Chla反演方法包括经验算法和半分析算法。其中OCx系列算法由O'Reilly等人开发,通过最大波段比法估算Chla浓度,已成为全球海洋Chla监测的重要工具。2019年,O'Reilly团队进一步优化了OC2、OC4算法,并扩展到OC3、OC5和OC6,通过光谱波段对齐确保了跨传感器一致性。然而,这些算法主要针对开阔大洋的清澈水体设计,在光学复杂的沿岸区域,由于悬浮颗粒物、有色溶解有机物等物质的干扰,其精度明显下降。研究表明,OCx算法在北大西洋北极低Chla区域往往高估浓度,而在高Chla区域则出现低估。
为应对这一挑战,美国国家航空航天局(NASA)的业务化Chla产品采用了混合算法,结合OC算法和颜色指数(CI),显著提高了低Chla浓度水域的反演精度。另一种主流方法是基于光学水体类型(OWT)的分类反演策略,通过识别不同水体的光学特性并适配相应算法,有效提升了Chla反演准确性。随着技术进步,机器学习(ML)和深度学习方法也被广泛应用于Chla反演,通过从大量遥感数据和实测数据中学习复杂的非线性关系,显著提高了反演的准确性和鲁棒性。
尽管现有方法在全球和局部水域表现出良好性能,但其普适性和扩展性仍有限制。机器学习模型基于特定的数学基础和假设构建,在不同数据类型上表现各异。同时,输入特征质量和原始光谱数据处理技术强烈影响算法性能,如何有效捕捉水体的光学特征和变化仍是关键挑战。此外,不同水体的独特光学属性可能无法被整合多种OWT的全局特征扩展方法完全捕捉,这影响了机器学习算法的精度。
在此背景下,崔玉胜、谢涛等研究人员在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了一项创新研究,提出了光学水体类型耦合的叶绿素a浓度反演网络(OWT-CCINET)。该方法通过结合光学水体分类、双流特征提取和多模型评估,实现了跨水体环境的高精度Chla反演,为复杂水环境监测提供了新的解决方案。
研究团队采用了几个关键技术方法:首先利用k-means聚类算法基于遥感反射率光谱将全球水体划分为四种光学类型;随后设计了一维卷积神经网络(1D CNN)与Transformer相结合的双流特征提取结构,分别捕捉光谱的局部和全局特征;针对每类水体测试了多种特征组合与回归模型的匹配效果,最终为每种水体类型确定了最优的反演模型组合。数据方面主要使用了全球原位生物光学数据集(版本3)以及独立的公开验证数据集,确保了模型的可靠性和泛化能力。
通过k-means聚类分析,研究将水体划分为四种具有明显光谱特征的光学水体类型。OWT 1(富营养化水体)在所有波长表现出低反射率,在555nm处达到峰值,主要分布在各大洲的沿岸和近海区域。OWT 2(浑浊水体)整体反射率最高,峰值同样出现在555nm附近,分布在特定沿海区域如墨西哥湾。OWT 3(清澈水体)在短波蓝光区域(400-450nm)出现峰值,随后随波长增加显著下降,具有典型清澈水体的光谱特征,主要分布在大西洋、太平洋和印度洋的开阔水域。OWT 4(中等浑浊水体)在450-500nm范围反射率较高,光学特性介于浑浊和清澈水体之间,主要出现在沿海区域、河口和一些特定热带区域。
研究比较了顺序和并行两种特征提取结构在不同OWT下的性能。对于OWT 1,顺序结构结合36个特征输出和XGBoost模型表现最佳;OWT 2选择并行结构结合15个特征输出和XGBoost;OWT 3采用顺序结构结合32个特征输出和CatBoost;OWT 4则使用并行结构结合18个特征输出和MLP。通过多模型评估策略,确保了每种水体类型都能匹配最合适的特征-模型组合,显著提高了反演精度。
在独立测试集上,OWT-CCINET整体表现出色,MAE为0.410,RMSE为0.549,R2达到0.899。不同OWT下的性能存在差异:OWT 1的MAE为0.450,RMSE为0.589,R2为0.823;OWT 2由于样本量少且光学复杂,R2仅为0.415;OWT 3表现最佳,MAE为0.267,RMSE为0.342,R2为0.870;OWT 4的误差较大,特别是在中高浓度范围。
与NASA的OC4_CI混合算法及其他主流机器学习模型相比,OWT-CCINET在内部测试集上将MAE和RMSE分别降低了约23%和22%,R2从0.833提升至0.899。在独立公开数据集上,OWT-CCINET保持了较低误差水平(MAE=0.513,RMSE=0.705)和较强的解释能力(R2=0.846),而OC4_CI算法则出现较大误差和显著高估。分组评估显示,OWT-CCINET在大多数水体类型中均优于对比模型,差异具有统计学显著性。
OWT-CCINET展现出优秀的空间映射能力。季节分类结果显示,清澈水体终年主导大洋中心,冬季分布略有扩展;富营养化水体夏季分布更广,冬季主要集中在中纬度沿海区域。与Copernicus-GlobColour产品相比,OWT-CCINET在细节捕捉方面表现更优,特别是在高纬度和低纬度区域。对热带气旋ARB 06的案例分析表明,该模型能有效识别气旋过后更广泛的浮游植物水华区域。
通过最小化的波段协调处理,OWT-CCINET在SeaWiFS、MERIS和MODIS传感器上均保持稳定的性能表现,证明了其良好的跨传感器泛化能力。这一特性使得该模型能够直接部署到新的海洋水色传感器上,大大降低了重新训练/重新校准的成本,确保了跨任务产品的一致性,支持长时间序列和多源融合应用。
研究的讨论部分深入分析了OWT的光学意义及其对Chla反演的影响。不同OWT具有独特的光谱特征:OWT 1中Chla通常较高,绿红波段对比更明显;OWT 2的高整体反射率和长波衰减反映了悬浮颗粒物和CDOM的共同影响;OWT 3呈现清澈水体的典型"蓝峰/长波衰减"特征;OWT 4介于清澈和浑浊水体之间,需综合考虑多个波段。这些光学特性促使了基于OWT的特征工程、模型选择和误差解释。
水体分类在反演任务中发挥着关键作用,通过识别不同OWT的独特光谱反射特征,增强了模型对各类水体光谱特征的特异性和适应性。双流特征提取结构进一步强化了这一优势,通过误差反馈和协同优化机制,实现对不同水环境下复杂光谱特征的自适应提取。多模型评估策略则确保了每种水体类型都能匹配最合适的回归模型,显著提高了反演精度和稳定性。
OWT-CCINET的创新性在于将水体分类、双流特征提取和多模型评估有机结合,为跨水体反演任务提供了高度灵活和自适应的解决方案。该模型不仅能保持高预测精度,还具备跨传感器适应性和对不同水体类型的反演鲁棒性,适用于全球和区域水色监测应用。同时,研究也指出模型性能仍受数据分布和参数设置的影响,在清澈水体中表现稳定,而在样本有限的浑浊水体中结果对特征维度、优化方法和聚类定义更为敏感。
该研究通过针对不同水体类型设计特征提取结构和反演模型,显著提高了Chla浓度反演精度,为复杂水环境下的模型开发提供了重要支持。通过灵活适应不同水体类型的光谱特征,该方法具有优异的应用潜力,特别是对于动态环境,其中基于像素的OWT识别能够在推理时实现专门回归器的即时选择,无需重新训练或时间平滑即可及时检测突变。随着持续优化,OWT-CCINET有望在水环境监测和灾害评估等广泛应用中发挥关键作用,为复杂水环境的监测和管理提供更可靠的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号