《Expert Systems with Applications》:Bridging Land and Sea: A Latent Diffusion Framework for High-Resolution Ocean Floor Mapping
编辑推荐:
海洋数字高程模型(DEM)重建需处理非格网数据(如船基声纳),传统方法依赖超分辨率模型但输入受限。本文提出潜在扩散模型(LDM)框架,将问题转化为不规则掩码图像补全任务,通过预训练 terrestrial DEM 数据库并微调少量海洋数据,有效利用地形形态相似性,实验验证其精度和效率均优于插值基线。
杜帅|邓强|钟伟|卢阳|钟琦贤|王中雷
中国厦门大学王亚楠经济研究所
摘要
海洋数字高程模型(DEM)的重建仍然是地球科学中的一个核心挑战,它对海洋导航、海洋学、资源勘探和环境监测有着直接影响。最近的深度学习方法主要依赖于应用于网格化DEM的超分辨率技术,因此未能充分利用日益增长的高分辨率非网格化观测数据(例如基于船舶的声纳数据)。为了解决这一差距,我们将基于非网格化数据的DEM重建视为一个修复问题,并提出了一种直接在非规则输入空间中运行的潜在扩散框架。由于大规模的标记海洋DEM数据非常稀缺,我们进一步采用了迁移学习技术,利用陆地和海洋地形之间的形态相似性。广泛的实验表明,我们的方法提高了重建精度,并且在非网格化海洋DEM上始终优于传统的插值方法。
引言
数字高程模型(DEM)是地球裸露地表地形的数字表示,在地理信息系统中得到了广泛应用。精确的网格化海洋DEM是许多与海洋相关活动的关键因素,包括安全导航、资源开发、生态保护和数值预测。先进的现代遥感卫星能够高效地获取高分辨率的陆地DEM数据,但由于电磁波无法穿透深水区域,同时用于水下测绘的声纳信号也无法从太空传输,因此无法直接绘制海底地形。例如,当全球网格化陆地DEM数据集(如哥白尼DEM,欧洲航天局和空客公司,2022年)已经可以公开使用时,海洋DEM数据的分辨率要低得多,这主要是由于基于船舶的声纳覆盖范围有限。例如,在“Seabed 2030”国际合作项目的推动下,研究人员已经成功绘制了近25%的世界海底区域,但大多数观测数据都是非网格化的基于船舶的声纳数据,相应的网格化数据集(如GEBCO海底地形编纂组,2024年)的分辨率仍然只有大约500米。
通过整合异构的海底地形数据集来获得高分辨率DEM是一个技术挑战。深度学习的最新进展将这一任务重新定义为计算机视觉问题,并取得了显著进展。一种流行的方法是将海洋DEM重建视为超分辨率问题,从低分辨率输入中生成高分辨率输出,如图1(a)所示(Sonogashira, Shonai, Iiyama, 2020; Zhang, Xiong, Ma, Wang, Wang, Huang, Yu, Zhang, Lu, Hong, Yu, Wang, Wang, Li, Gong, Huang, 2022)。然而,这种方法从根本上受到其对网格化输入数据要求的限制。在区域海洋地形研究中,基于船舶的声纳覆盖范围稀疏,通常会产生大量间距不规则的测量数据(图1(b)),当前的超分辨率模型无法直接利用这些数据。因此,研究人员通常采用插值技术从这些非网格化数据中重建DEM,但这些方法高度依赖于相邻数据点的密度,因此经常导致次优结果。通过放宽对均匀网格化输入的依赖,未来的方法可以整合更广泛的观测数据,从而提高海洋DEM重建的空间覆盖率和精度。
本文致力于从不规则、非网格化的观测数据中重建高分辨率的海洋DEM。我们将这个问题视为DEM修复问题,并采用了一种迁移学习流程:首先在丰富的陆地DEM上预训练潜在扩散模型(LDM),然后在少量海洋DEM数据上进行轻度微调,以较低的计算成本实现详细的重建。我们的贡献包括:
•问题提出。我们提出并形式化了直接从非网格化测量数据(例如基于船舶的声纳数据)重建海洋DEM的任务,这是一个非常实际但尚未充分探索的领域。据我们所知,这是第一项专注于此任务的研究。
•方法。我们提出了一个基于LDM的修复框架,结合了迁移学习,利用陆地地形来克服标记海洋数据的稀缺性,从而提高了准确性和效率。
•评估。我们进行了全面的实验研究,证明所提出的方法在海洋DEM数据上始终优于传统的插值方法。
本文的结构如下:第2节回顾相关工作;第3节介绍我们的方法;第4节详细介绍了数据准备、陆地预训练和迁移学习实验以及方法比较;第5节总结并概述了未来的研究方向。
章节摘录
DEM重建
当前主流的DEM重建方法主要依赖于超分辨率模型(Demiray, Sit, Demir, 2021; Lin, Zhang, Wang, Yao, Chen, Cheng, Li, 2022)。特别是在海洋DEM重建的背景下,超分辨率模型仍然是主要技术(Sonogashira, Shonai, Iiyama, 2020; Zhang, Xiong, Ma, Wang, Wang, Huang, Yu, Zhang, Lu, Hong, Yu, Wang, Wang, Li, Gong, Huang, 2022)。例如,Zhang等人(2022年)训练了卷积神经网络
问题提出
DEM记录了二维平面上每个点的高程数据,本质上类似于单通道图像数据,其中高程值对应于像素强度。这种相似性使我们能够将基于非网格化数据的海洋DEM重建任务重新定义为不规则遮罩图像修复问题,并随后使用LDM来重建缺失值。
LDM的核心数学原理
LDM(Rombach等人,2022年)将预训练的变分自编码器(VAE)与DDPM结合在一起,同时执行所有随机操作
数据整理
对于陆地DEM数据,本研究使用了2010年全球多分辨率地形高程数据(GMTED2010,Danielson & Gesch,2011年),这是美国地质调查局和国家地理空间情报局的合作产品。选择该数据集进行分析,其空间分辨率为7.5弧秒。这些数据以单通道GeoTIFF文件的形式分发,覆盖特定的地理区域,每个瓦片的尺寸为14,400×9,600像素结论与展望
我们将海洋DEM重建视为一个不规则遮罩图像修复问题,并提出了一种直接在非网格化数据(例如基于船舶的声纳观测数据)上运行的LDM架构。该流程首先使用VAE压缩数据,然后在潜在空间中进行随机去噪,最后解码出完整的海洋DEM数据。通过在丰富的陆地DEM上进行预训练,并用有限的海洋DEM数据进行微调,该模型有效地将陆地上的形态先验转移到了海洋上
未引用的参考文献
缺失的引用:Kingma & Welling (2013)CRediT作者贡献声明
杜帅:概念化、方法论、数据整理、形式分析、验证、可视化、初稿撰写、审稿与编辑。邓强:概念化、方法论、数据整理、资源准备、初稿撰写、审稿与编辑。钟伟、卢阳、钟琦贤:概念化、方法论、资源准备。王中雷:概念化、方法论、监督、资源准备、审稿与编辑。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。