编辑推荐:
研究人员构建 CUGUV 数据集并提出新框架,提升城中村映射模型性能,推动城市规划发展。
### 城中村研究:从难题到突破
在城市飞速发展的进程中,城中村(Urban Village,UV)就像一个个独特的 “小世界” 隐藏在城市之中。曾经的它们或许是乡村聚落,在城市化浪潮的席卷下,逐渐被城市包围。与国外的 “贫民窟” 不同,由于我国独特的土地制度和城市化发展模式,城中村有着自己鲜明的特点。狭窄的街道、密密麻麻的建筑、有限的绿化,还有卫生条件差、公共设施不足等问题,让城中村在为众多外来务工人员提供低成本住所的同时,也存在着诸多安全隐患。
精准确定城中村的范围,对于城市的合理规划、政策的精准制定以及居民生活质量的提升至关重要。传统的实地调查虽然数据相对准确,但耗费大量人力物力,还容易受到地方政府对城中村定义差异的影响。而利用遥感影像进行识别和监测,虽然高效又客观,但想要从复杂的影像中精准找出城中村却困难重重。因为城中村没有明显对应的光谱、纹理特征,还和一些老旧城区的胡同、小巷等区域长得很像,传统的像素和基于对象的图像分析方法都难以准确识别。
近年来,深度学习在各个领域大放异彩,在城中村识别方面也取得了一定成果。不过,现有的研究大多聚焦于个别城市,导致多数城市缺乏可解读的城中村地图,公众对这些城市城中村的分布和演变了解甚少。而且样本数量不足、多样性不够,使得深度学习模型的可靠性和可转移性大打折扣。
为了解决这些难题,中国地质大学(武汉)等研究机构的研究人员展开了深入研究。他们构建了一个大规模的基准数据集 CUGUV,并提出了一种创新的框架,相关研究成果发表在《Scientific Data》上。
研究的技术方法
研究人员在构建 CUGUV 数据集时,进行了多方面的工作。首先,他们精心挑选了 15 个具有显著城中村现象的主要城市,这些城市地域跨度大,涵盖了不同地形和气候区域,经济发展水平也各有差异,为数据的多样性提供了保障。数据来源上,利用 Google Earth 的高分辨率影像和开源的 Landsat - 8 卫星图像,还获取了 15 个城市的矢量建筑层数据。
在样本处理过程中,经过学习、标注、质量控制和后处理等多个严格阶段。学习阶段,团队成员通过研究高分辨率卫星图像和航拍照片,统一对城中村的认知,制定标注准则;标注阶段,严格按照准则,利用高分辨率卫星影像手动勾勒城中村边界;质量控制阶段,由独立团队审查数据,借助街景照片和无人机图像辅助,确保数据可靠性;后处理阶段,将样本转换为规则图像补丁,进行清洗和尺寸调整。
基于 CUGUV 数据集,研究人员开发了一种多源融合和深度学习框架。该框架以 Segformer 模型为骨干,融合了额外的光谱和建筑特征,以及传统卷积特征。采用四个光谱指数(如归一化植被指数 NDVI、归一化水体指数 NDWI 等)描述城中村区域特征,还计算了建筑密度(BD)和平均建筑高度(MBH)等建筑指数,从多个维度辅助城中村的识别。
研究结果
- CUGUV 数据集概况:CUGUV 数据集可从指定链接免费下载,包含 2604 个标准化的 512×512 像素的规则补丁,来源于 15 个城市的 845 个城中村多边形。这些样本被按照 3:1:1 的比例分为训练集、验证集和测试集。该数据集具有规模大、异质性高、地理鲁棒性强的特点,能有效评估和提升模型的性能12。
- 不同模型的比较:研究人员将自己提出的模型与多个先进的语义分割模型进行比较,结果显示,该模型在整体准确率(92.82%)、平均交并比(86.80%)、精度(92.72%)、召回率(90.18%)和 F1 分数(92.77%)等指标上均达到最高,性能优于其他模型,展现出强大的鲁棒性和有效性34。
- 模型的可转移性测试:为验证模型跨城市的适应性,研究人员进行了可转移性测试。用一个城市的样本训练模型,再用于识别其他城市的城中村。结果发现,仅用单个城市样本训练的模型在跨城市应用时准确率大幅下降。但相比 Segformer 模型,研究人员提出的模型可转移性更优,在部分情况下准确率提升明显56。
- 消融实验:以 Segformer 为基线进行消融实验,结果表明单独使用光谱指数或建筑指数训练的模型准确率较低,而将这些指数与高分辨率图像结合,能提高准确率。研究人员提出的融合所有指数和图像的框架,准确率最高,证明了数据融合策略的有效性78。
研究结论与意义
研究人员构建的 CUGUV 数据集和提出的多源融合深度学习框架,在跨城市城中村映射任务中表现出色。CUGUV 数据集为评估和改进模型的鲁棒性与可转移性提供了基础,新框架有效整合和学习多源数据,显著提升了模型性能。这不仅有助于我们更深入地了解城中村这一复杂多样的现象,还能精准绘制大规模城中村地图,为城市规划者、政策制定者提供有力的数据支持和技术保障,推动城市的合理规划和可持续发展。同时,研究人员也计划进一步拓展数据集,探索新的数据来源和特征,优化数据融合和深度学习框架,持续提升大规模城中村映射的准确性,为城市发展贡献更多力量。