一种多任务深度学习框架,用于提高云顶高度反演的准确性
《International Journal of Digital Earth》:A multi-task deep learning framework for enhancing cloud-top height retrieval accuracy
【字体:
大
中
小
】
时间:2025年12月21日
来源:International Journal of Digital Earth 4.9
编辑推荐:
云顶高度(CTH)是影响云辐射效应的关键参数,本研究提出多任务卷积神经网络(MultiTask-CNN),通过整合FY-4A AGRI卫星数据、ERA5再分析数据及CALIOP/CPR联合云产品,同步反演CTH、云相和多层云信息。实验表明,相比传统CNN、XGBoost和两阶段模型,MultiTask-CNN的RMSE降低至1.70 km,MAE为0.79 km,R2达0.90,尤其对多层和高云的预测精度显著提升,验证了多任务学习框架在复杂云结构分析中的有效性。
云顶高度(Cloud Top Height, CTH)作为影响云辐射效应的关键参数,其准确估算对气候模型和天气预报精度提升至关重要。传统被动遥感方法如红外通道反演、CO?切片法或分窗技术,在多层云、薄云及复杂气象条件下常出现较大误差,主要受限于物理模型简化、数据维度不足及云结构动态关联性捕捉困难。近年来,深度学习在遥感领域的应用逐渐兴起,但多数研究仍将CTH反演视为单一任务,未能充分利用云相、垂直结构等物理信息的辅助作用。
本研究提出一种创新的多任务深度学习框架(MultiTask-CNN),通过联合优化CTH回归、云相分类和云层结构判别三个目标,显著提升被动遥感数据的反演精度。研究基于FY-4A卫星搭载的AGRI(先进静止气象辐射成像仪)数据、ERA5再分析数据以及CALIOP/CPR(云 profiling 雷达/大气激光雷达)的联合产品,构建了覆盖全球中纬度地区(60°S–60°N,50°E–160°E)的2018年1-6月综合观测数据集,共包含119,255个同步样本。数据预处理中,通过±15分钟时间窗口匹配、空间邻近网格筛选及晴空像元剔除,确保输入数据与CALIOP/CPR的主动探测参考结果高度一致性。
模型架构采用三阶段设计:输入层整合AGRI的14通道光谱温度数据(0.47-13.5 μm)、地理坐标及ERA5的37层大气垂直剖面数据;三个一维卷积层提取光谱-垂直联合特征;共享全连接层处理多任务目标,独立输出层分别生成CTH值、云相类别(水/冰)和云层结构(单层/多层)。核心创新在于引入动态权重机制,通过自适应调整回归与分类任务的损失权重(β值),平衡不同任务对模型优化的贡献。实验表明,当β=0.4时,RMSE(均方根误差)降至1.70公里,MAE(平均绝对误差)为0.79公里,R2(决定系数)达0.90,较传统单任务模型提升约15-20%。
对比实验显示,基于物理约束的TwoStage-CNN虽在流程上分阶段处理云相与CTH,但其RMSE仍比多任务框架高0.18公里。XGBoost作为传统机器学习方法,在处理高维时空数据时表现出显著局限,其RMSE达1.88公里,且对多层云的预测稳定性较差。特别值得注意的是,多任务框架在高层冰云(7.5-17公里)的误差降低最为显著,RMSE从TwoStage-CNN的2.5公里降至1.39公里,这得益于云相分类任务对特征提取的引导作用。消融实验进一步证实,整合云层结构分类(如单层/多层)与云相分类(冰/水)的联合任务设计,相较单一任务模型,能有效捕捉云垂直结构的物理关联,例如在冰云中,多层结构的识别可辅助纠正云顶高度在10-12公里处的系统性偏差。
模型性能的时空异质性分析显示,CTH反演误差随卫星观测仰角(天顶角)增大而显著升高(RMSE波动范围1.4-2.1公里)。这种空间变化与云场非均质性密切相关:在赤道地区,低空水云占比达68%,其CTH集中在1-3公里,模型MAE控制在0.5公里以内;而中纬度地区高空冰云比例较高,需依赖CALIOP的垂直探测数据修正模型对光学厚度与高度关系的误判。研究特别指出,多任务框架在处理云相误分类时表现出更强的鲁棒性,例如将冰云误判为水云的概率从单任务CNN的5.2%降至4.1%,这主要得益于共享特征提取层对光谱温度与垂直结构关联的联合优化。
在算法设计层面,研究突破了传统深度学习模型的结构局限。通过将云相(水/冰)和云层结构(单层/多层)作为辅助分类任务,构建了包含83个输入特征(14通道温度+37层大气参数+地理坐标)的卷积神经网络。实验证明,引入动态权重机制后,分类任务对回归输出的正则化效应增强,尤其在薄云和破碎云检测中,分类损失对特征学习的约束使模型对微弱温度信号的敏感性提升23%。这种多任务协同机制有效解决了传统方法中云相误判导致的垂直结构建模偏差,例如在单层水云中,误分类导致的特征扭曲使CTH误差扩大,而多任务框架通过分类任务的监督,将此类误差降低至0.6公里以内。
应用案例研究表明,多任务框架在应对突发性强对流云团时展现出独特优势。2018年4月8日04:00(UTC)的台风外围云系(图5a),传统CNN模型在云层交叠区出现明显的CTH虚高(达2.8公里),而MultiTask-CNN通过云层结构分类任务的约束,将此类区域的RMSE控制在1.2公里以内。在2018年5月30日09:00(UTC)的副热带高压区(图5c),多任务框架对破碎云团的分层识别能力,成功将单层水云与多层云的交叉误判率从17.3%降至9.8%,进而提升CTH反演的垂直分辨率。
该研究还存在若干待完善方向:首先,当前数据集的时间跨度有限,需扩大至多季节验证;其次,在低云(<2公里)反演中,受大气透射率非线性影响,MAE仍维持在0.8公里左右,未来可通过引入地基观测数据提升该区域的反演精度;最后,模型对极地地区云相识别的FAR(假阳率)值(1.2%)仍高于中纬度地区(0.8%),这可能与极地大气稳定度导致的云结构复杂性差异有关。
该成果为气象卫星数据的高效利用提供了新范式,其多任务协同机制可推广至其他云物理参数的反演。研究团队计划在2025年通过扩展训练数据集(纳入MODIS、VIIRS等数据源)和引入注意力机制,进一步提升复杂云场景下的反演鲁棒性。这些改进将推动静止卫星云图产品的空间分辨率(从5公里提升至1公里)和时效性(从小时级到分钟级)的跨越式发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号