基于自动编码器的框架,用于分析城市绿地需求的区域差异
《Frontiers in Sustainable Cities》:An autoencoder-based framework for analyzing regional variations in urban green space demand
【字体:
大
中
小
】
时间:2025年09月19日
来源:Frontiers in Sustainable Cities 2.1
编辑推荐:
本研究提出基于自动编码器的多维绿地需求评估框架,整合人口密度、地表温度及二氧化碳浓度指标,采用高斯两步浮动集盖面积法计算成都中心城区的绿地需求,并通过K-means++聚类揭示空间异质性。结果表明,碳汇需求集中于高排放核心区,散热需求在外围区域,可达性需求在人口密集区显著。自动编码器相比PCA显著降低重建误差(4.71×10?? vs 3.01×10?3),有效捕捉非线性关系,为绿地优化配置提供科学依据。
城市绿色空间在缓解环境压力和提升城市宜居性方面发挥着至关重要的作用。然而,现有的绿色空间需求评估方法往往忽视了多维度的交互作用和非线性关系,难以全面反映城市内部复杂的生态与社会需求。为此,本研究提出了一种基于自编码器的评估框架,整合了生态和社交指标,如地表温度(LST)、二氧化碳浓度和人口密度,通过深度学习方法对区域绿色空间需求进行分析。以成都中心城区为研究对象,我们利用高斯两步移动搜索法(Ga2SFCA)量化了绿色空间在可达性、热岛效应缓解和碳汇能力方面的需求,随后通过自编码器驱动的特征提取和k-means++聚类算法进行进一步分析。研究结果揭示了显著的空间异质性:碳汇需求主要集中在高排放的中心城区,热岛效应缓解需求在周边高温区域达到峰值,而可达性不足则主导了人口密集区域的绿色空间需求。自编码器相较于传统主成分分析(PCA),在重构误差方面表现更优,达到4.71×10??,而PCA为3.01×10?3,且自编码器能够通过可解释的潜在特征捕捉变量之间的非线性关系。本研究提出的框架为优化绿色空间分配、应对气候变化和实现城市规划中的公平性提供了空间精细、数据驱动的工具,推动了可持续城市发展,为政策制定者提供了可操作的决策依据。
研究区域为成都市中心城区,即位于成都绕城高速范围内的区域。该区域属于典型的亚热带季风气候区,年平均气温约为16℃。作为高密度、高度城市化的区域,成都中心城区不仅面临绿色空间资源分布不均的问题,还存在绿色空间覆盖率不足的情况。特别是在高人口密度区域,绿色空间供应与需求之间的不匹配更加明显,加剧了城市热岛效应,也对居民的生活质量和生态环境造成负面影响。据统计,成都中心城区共有657个绿色空间斑块,总面积达7094公顷。尽管人均绿地面积达到11.02平方米,但大多数绿地集中在城市外围,难以满足中心城区的生态和社会需求。这表明当前的城市绿地系统存在明显的碎片化和孤立性。
在数据收集和处理阶段,研究数据主要来源于遥感影像、城市地理信息和地理信息系统(GIS)数据集。具体包括2024年的地表温度(LST)TIFF数据、2022年的二氧化碳浓度TIFF数据、2024年的城市人口密度TIFF数据、成都中心城区的边界数据以及2024年的城市绿地Shapefile(SHP)数据。所有数据经过空间统一处理,确保坐标系统和分辨率的一致性,从而为后续分析提供了坚实的数据基础。在数据预处理过程中,所有数据集都经历了严格的坐标注册、使用k近邻插值法进行缺失值填补以及格式标准化,以确保数据结构的统一。为了增强无监督学习的鲁棒性,我们采用了基于四分位距(IQR)的稳健异常值检测方法,对极端值进行Winsorization处理,并结合RobustScaler(scikit-learn实现)进行非参数缩放,以消除异常值对后续自编码器训练的影响。最终,通过GIS进行空间叠加和分析操作,得到了每个网格单元的绿色空间需求指标,为后续的特征提取提供了更精细的数据集。
研究方法采用了一种基于自编码器的框架,旨在综合考虑社会和生态维度。首先,将城市划分为边长为200米的六边形网格单元,作为空间分析的基本单位。接着,使用改进的两步浮动捕获区域(2SFCA)方法,结合高斯衰减函数,分别计算基于绿色空间可达性、热岛效应缓解能力和碳汇能力的绿色空间需求。自编码器通过编码器部分对输入数据进行特征学习,提取绿色空间需求特征和其他相关特征。最后,将提取的潜在特征通过k-means++聚类算法进行降维,以确定不同区域的绿色空间需求差异。通过模型训练的收敛过程,最终实现了对城市绿色空间需求的科学评估,为优化绿色空间资源配置提供了依据。
在自编码器的训练过程中,我们采用Adam优化器和SELU激活函数,以确保模型的稳定性和高效性。训练过程共进行了100个epoch,每个epoch使用32个样本的批量大小。通过训练,自编码器能够将输入数据从三维空间压缩到八维潜在空间,同时保持较低的重构误差。具体来说,重构误差在训练后期稳定在约4.71×10??,表明模型在压缩和重构过程中有效保留了关键信息。此外,自编码器通过编码器提取的潜在特征不仅减少了数据维度,还增强了模型对数据内在结构的捕捉能力。随后,使用k-means++算法对这些潜在特征进行聚类分析,将数据划分为10个不同的需求等级,进一步揭示了绿色空间需求的区域差异。
通过自编码器的潜在特征提取和k-means++聚类分析,我们能够更精确地识别不同区域的绿色空间需求强度。研究结果表明,碳汇需求主要集中在高排放的中心城区,而热岛效应缓解需求则在高温的外围区域达到峰值。同时,可达性不足在人口密集区域尤为突出,表明这些区域需要更多的绿色空间以满足居民的需求。这些发现对于城市规划和管理具有重要的指导意义,有助于制定更加科学的绿色空间分配策略,以应对气候变化带来的环境压力,同时提升居民的生活质量。
此外,本研究还对自编码器与传统主成分分析(PCA)在数据降维和特征提取方面的表现进行了比较。PCA作为一种线性降维方法,假设数据之间存在线性关系,因此在处理非线性数据时存在局限性。相比之下,自编码器作为非线性降维方法,能够更有效地捕捉数据中的复杂关系。通过计算重构误差,我们发现自编码器的性能显著优于PCA,其重构误差仅为4.71×10??,而PCA为3.01×10?3。这表明自编码器在保留数据复杂性和非线性关系方面更具优势,能够更准确地重构输入数据。通过对比分析,我们发现自编码器不仅能够更好地保留数据的多样性,还能够捕捉到数据中的细微变化,从而提供更全面的特征表示。
在特征提取能力分析方面,我们使用了部分依赖图(PDP)对自编码器提取的潜在特征与原始变量之间的关系进行了可视化。PDP分析显示,不同潜在特征对HIEMC、GSA和CSC的依赖关系存在显著差异。某些潜在特征主要依赖于CSC,如feature_6;而另一些则对GSA更为敏感,如feature_1;还有部分潜在特征对HIEMC有较强的响应,如feature_7。此外,某些潜在特征对两个或三个变量均表现出较高的敏感性,但方向可能不同。这种多维敏感性表明,不同的潜在特征可能对应于不同的城市环境模式。例如,“城市热岛和人口密集区域”可能主要由热岛效应和人口密度驱动,而“工业排放和低人口区域”则可能与二氧化碳浓度和人口密度密切相关。“极端高温无人区”可能出现在地表温度极高但人口密度较低的区域。这些模式的具体含义需要结合潜在特征的空间分布和实际城市环境情况进行进一步验证。
在激活函数的选择上,我们对自编码器模型中五种常见的激活函数进行了比较,以确定哪种函数在训练过程中表现最佳。从重构误差曲线来看,不同激活函数在自编码器训练过程中表现出不同的性能。其中,SELU激活函数表现最为优异,其误差在整个训练过程中保持平滑下降,最终重构误差最低。ELU和LeakyReLU也表现出良好的性能,其误差在训练初期波动较大,但随后迅速下降并趋于稳定。相比之下,ReLU激活函数虽然在初始阶段收敛较快,但最终重构误差略高,这可能是由于其在深层网络中容易出现梯度消失问题。Tanh激活函数则表现较差,尽管它避免了ReLU的“死亡神经元”问题,但其梯度饱和特性导致训练速度较慢,最终重构误差较高。因此,SELU在本研究中表现出最佳性能,适用于深层自编码器模型。LeakyReLU和ReLU在SELU不适用的情况下可以作为更稳健的替代方案,而Tanh则在深层网络中表现欠佳。
本研究在方法和应用层面也存在一定的局限性。首先,研究未纳入实时空气质量指数(如PM?.?和NO?浓度)、植被健康指标(如NDVI和EVI)以及经济活力指标(如夜间灯光强度和POI密度),这可能限制了模型在商业和工业区域对需求异质性的刻画能力。其次,尽管自编码器提取的8维潜在特征具有较强的区分能力,但输入变量(HIEMC、GSA、CSC)与编码表示之间的非线性映射仍然存在一定的不透明性,这可能阻碍了对需求驱动因素的机制解释。此外,尽管我们采用了基于IQR的异常值检测和RobustScaler标准化,但遥感LST数据中的高频噪声(由于大气瞬时效应)仍可能通过无监督流程传播,导致聚类边界界定的不稳定性,尤其是在微气候变化显著的区域。
针对这些局限性,未来的研究方向将包括以下几个方面:首先,引入多维指标融合框架,整合Sentinel-5P大气NO?柱密度、VIIRS夜间灯光合成数据(500米分辨率)和高分二号NDVI时序数据(8米分辨率),以量化污染暴露、经济活动和植被压力。其次,应用时空图神经网络(ST-GNN),结合基于注意力机制的LSTM模块,捕捉超过5年观测窗口的需求轨迹。第三,构建混合解释框架,利用SHAP(Shapley Additive Explanations)量化特征对潜在维度的贡献,生成空间明确的归因图。最后,采用自适应噪声抑制技术,如离散小波包变换(db8母小波),在自编码器训练前分离季节性噪声(如夏季LST异常)和持续需求信号,优化MODIS LST数据集的信噪比。
综上所述,本研究通过自编码器框架对城市绿色空间需求进行了创新性评估,并将其应用于成都中心城区的绿色空间需求分析。通过整合人口密度、地表温度和二氧化碳浓度等多维度生态和社会指标,我们克服了传统方法在单独处理生态和社会维度方面的局限性。该框架不仅提供了更准确和全面的绿色空间需求分析,还显著增强了城市绿色空间资源配置的科学依据。研究结果表明,自编码器能够有效揭示绿色空间需求的复杂性和空间异质性,捕捉数据中的非线性关系,准确反映绿色空间需求与环境变量(如温度、二氧化碳浓度和人口密度)之间的深层联系。相比传统方法,自编码器框架在提升模型精度、揭示环境变量之间的深层交互以及增强绿色空间需求评估的空间精度方面具有明显优势。本研究不仅为评估城市绿色空间需求提供了一种新的方法和思路,也为未来城市生态规划、绿色基础设施发展和气候适应性规划的研究提供了重要参考。通过深入分析生态和社会维度的交互作用,我们能够更好地识别和应对城市绿色空间需求的空间差异,为实现可持续城市发展目标提供坚实的理论支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号