《Ecological Frontiers》:Machine learning for land use and land cover mapping in Google earth engine: A review of methods, applications, and challenges
编辑推荐:
本研究系统综述了Google Earth Engine(GEE)平台中机器学习算法在土地利用与土地覆盖(LULC)分类中的应用,比较了随机森林(RF)、支持向量机(SVM)与深度学习(如卷积神经网络)的精度(80%-98%),分析了景观异质性、数据分辨率等影响因素,并探讨了整合ML与GEE的挑战及优化路径。
Y. Dinesh Kumar Reddy|Dipankar Roy|G. Nakkeeran|Narala Gangadhara Reddy
印度安得拉邦Madanapalle市Madanapalle理工学院与科学学院土木工程系,邮编517325
摘要
理解和分析土地利用与土地覆盖(LULC)制图对于科学研究、经济规划和政策决策等各个领域的明智决策至关重要。持续监测LULC的变化对于有效管理自然资源和评估气候变化的影响是必要的。Google Earth Engine(GEE)作为一个强大的开源平台,为高级地理空间大数据分析提供了有力支持。通过利用机器学习算法,GEE能够利用各种类型的卫星数据源生成准确且信息丰富的LULC地图。本研究对相关研究进行了全面分析,重点探讨了算法趋势以及不同模型在LULC制图中的相对有效性。文献综述显示,随机森林模型是最常用的模型,其准确率始终在80%到95%之间。深度学习方法(包括卷积神经网络)在高质量地图制作中表现出更强的性能,准确率可达90%至98%。此外,本文还讨论了将机器学习与GEE结合时面临的关键挑战,如编程的复杂性以及与空间和时间分辨率相关的数据限制。这一资源对于研究者和实践者来说是一个重要的工具,有助于他们利用GEE进行高级LULC制图及其他地理空间应用。
引言
地球表面不断发生变化,这些变化受到自然现象和人类活动的影响。通过土地利用与土地覆盖(LULC)分析来理解这些变化对于应对气候变化、城市化和生物多样性丧失等全球性问题至关重要。LULC揭示了人类活动与自然景观之间的复杂关系,为我们提供了关于人类如何与环境互动的基本理解[1]。
分析LULC有助于识别因森林砍伐或城市扩张而导致温室气体排放增加的区域,从而制定植树造林策略和更有效的土地管理方法(S. [2])。LULC分析在城市化过程中也发挥着重要作用,它有助于规划可持续城市、监测城市扩张并促进土地的合理利用。识别出处于风险中的关键栖息地和生态系统对于应对生物多样性下降问题以及指导保护工作和政策制定非常有益[3]。图1展示了LULC制图的优势。
有多种模型和统计工具可用于模拟LULC的变化。其中,遥感技术尤为有效,因为它能够提供高分辨率的数据,并且具有广泛的适用性,适用于不同地理和时间尺度的变化检测[4]。遥感技术通过在卫星或飞机上安装传感器来收集地球表面的图像,从而随时间提供连续且全面的数据。这些信息对于进行持续分析至关重要,有助于识别趋势和模式,为环境管理和政策制定提供宝贵见解[5]。然而,使用传统方法处理大量数据时存在一些障碍,例如如何同步来自不同传感器、具有不同质量和时间分辨率的图像。这些差异可能会影响不同时间框架下数据的比较和评估精度,而传感器校准、大气条件和空间分辨率的变化也会给分析带来复杂性[6]。
近年来,大规模数据集、云计算和机器学习的结合显著改变了LULC分析和制图的方式。这一进步使研究人员能够以前所未有的规模分析海量卫星图像。Google Earth Engine(GEE)作为一个基于云的平台,在这一发展中发挥了重要作用,它为研究人员提供了存储了大量卫星图像和地理数据集的设施(涵盖数拍字节的数据)。通过整合机器学习算法的功能,GEE提高了LULC分析的准确性和效率[7,8]。
传统上,LULC分析依赖于基于桌面的地理信息系统(GIS),但这在开展大规模研究时带来了诸多挑战[9]。这些挑战包括下载和存储完整卫星数据集所需的大量数据,以及所需的强大本地计算资源,这些都限制了分析的范围和速度[10]。将机器学习算法与GEE平台相结合有效地解决了这些问题。GEE采用基于云的架构,在服务器端运行,这与传统的GIS方法不同[11]。这种方法消除了对本地数据存储的需求,直接提供了可分析的卫星图像的多拍字节级目录。这种变革使得大规模地理空间分析变得可行,研究人员能够以极高的速度和效率处理大陆甚至全球范围的数据集,而这在过去仅限于拥有高性能计算资源的机构[12,13]。
Nasiri等人[14]使用GEE中的Landsat时间序列数据研究了1991年至2021年间德黑兰的城市发展[14]。该研究强调了将遥感方法与随机森林(RF)和支持向量机(SVM)等先进算法相结合的有效性,以生成准确的LULC地图。Mirmazloumi等人[15]利用GEE对欧洲的LULC变化进行了全面研究,强调了城市化对自然景观的影响以及精确、广泛监测LULC对可持续发展规划的重要性。Pande等人[16]进一步使用GEE和分类回归树(CART)分析了LULC变化对蒸发蒸腾率的影响,进一步证明了土地覆盖变化与气象因素之间的相互依赖性。此外,表1总结了来自不同地理区域的关键研究,概述了它们的数据集、应用的机器学习算法及主要目标。
大规模数据存储库、云计算和机器学习的结合极大地提升了监测和理解LULC变化的能力和精度。这些进步有助于开发更高效、更可持续的解决方案,从而提高环境管理和政策决策的质量[26,27]。
本综述全面分析了在GEE平台上使用机器学习技术进行LULC制图的情况,重点探讨了算法趋势和性能比较。该研究通过结构化的分析评估了关键因素(如景观异质性、数据分辨率和分类目标)对主要机器学习和深度学习模型性能的影响,而不仅仅是列出各种方法。最终形成了一个实用的、基于证据的框架,帮助研究人员系统地选择最适合他们特定目标的模型。
研究方法
LULC分析方法
本综述采用系统的文献筛选程序来识别相关研究。研究使用了三个主要的学术数据库:Scopus、Web of Science和Google Scholar。用于进行全面和针对性搜索的布尔搜索字符串如下:(“LULC” OR “Land Use Land Cover”)AND (“Machine Learning” OR “Random Forest” OR “SVM” OR “Deep Learning”)AND (“Google Earth Engine” OR “GEE”)。研究的时间范围具体如下
数据获取
数据获取是LULC制图的关键阶段,因为它为准确分析和分类奠定了基础。这一过程涉及获取相关的卫星图像和补充的地理空间信息,以支持决策制定并提高制图的效果(Y. [28])。文中概述了数据获取的主要来源和技术,确保研究人员和从业者能够全面了解该领域可用的各种方法。
结论与建议
将机器学习技术集成到GEE中进行LULC分类,提高了大规模地理空间分析的准确性、可扩展性和整体效果。将各种机器学习模型(如RF)与深度学习框架(如CNN和RNN)相结合,实现了LULC分类的自动化,提高了预测建模的效率,并有助于多时相变化检测。研究结果表明,RF模型在这方面表现尤为突出
作者贡献声明
Y. Dinesh Kumar Reddy:撰写初稿、方法论制定、数据整理、概念构思。Dipankar Roy:撰写、审稿与编辑、方法论制定、数据整理、概念构思。G. Nakkeeran:撰写、审稿与编辑、概念构思。Narala Gangadhara Reddy:撰写、审稿与编辑、概念构思。
利益冲突声明
作者声明在本文的研究、作者身份和发表过程中不存在任何潜在的利益冲突。