编辑推荐:
为解决建筑多属性数据获取难题,研究人员构建 CMAB 数据集,精度大多超 80%,助力城市规划与可持续发展。
在城市化的浪潮中,城市如同一座座不断生长和变化的巨型有机体,而建筑则是构成这些有机体的 “细胞”。过去二十年,全球城市迅速扩张,建筑的三维形态和社会功能变得日益复杂。要想深入了解城市的发展规律,精准把握城市的脉搏,从建筑数据集中获取精细的三维物理和社会结构信息至关重要。然而,当前的建筑数据集却存在诸多问题。一方面,大规模的三维建筑数据集,尤其是包含几何属性(如屋顶、高度、结构和朝向等)的数据集十分稀缺;另一方面,建筑指示属性(如功能、风格、年龄、质量和空置情况等)的提取缺乏标准化的定义和方法,现有数据集过度侧重几何属性,难以让我们全面理解城市结构。
为了突破这些困境,清华大学的研究人员开展了一项极具意义的研究。他们利用人工智能技术,整合多源数据,成功构建了中国首个全国规模的多属性建筑数据集(CMAB)。这一成果发表在《Scientific Data》上,为城市规划、研究以及实现可持续发展目标(SDGs)带来了新的曙光。
研究人员在构建 CMAB 数据集时,运用了一系列关键技术方法。首先,在数据准备阶段,他们定义了空间城市边界,以确定数据产品的提取范围,并基于中国的气候区和行政城市级别选取建筑样本。其次,在几何属性提取方面,通过手动标注增强屋顶样本,训练 OCRNet 模型来提取建筑屋顶,并利用空间聚合方法计算建筑的形态、密度和位置特征,进而获取建筑高度。对于指示属性提取,研究人员利用多源数据,结合建筑高度预测功能特征,通过空间匹配和对象检测为每栋建筑实例分配年龄和质量属性,还通过微调多模态模型得到建筑结构和风格属性。最后,为确保数据的准确性,研究人员进行了严格的模型评估和验证,包括对模型性能的测试、与相关已发表数据集的比较,以及通过手动标注街景图像(SVIs)验证建筑的多个属性。
下面让我们详细了解一下研究结果。在数据记录方面,CMAB 数据集以标准 GIS 格式存储,按省份和自然城市组织,每个建筑屋顶以地理坐标系统 WGS1984 中的多边形表示,包含建筑屋顶、高度、功能、年龄和质量等属性,可在 Figshare 上获取。在技术验证环节,研究人员对数据集进行了全面评估。对于建筑屋顶,OCRNet 模型在相关数据集上的 mIoU(平均交并比)、Recall(召回率)和 Precision(精度)等指标表现出色,模型的 Accuracy(准确率)达到 91.59%,mIoU 为 81.95%,F1 分数为 89.93%,Kappa 系数为 79.86%,表明该模型能够准确识别中国不同地区的建筑。在建筑高度预测上,除了 E 级分区模型外,其他分区模型的精度指标均超过组合模型,且通过与其他产品比较,CMAB 数据集在大部分建筑高度预测上表现更优,不过对于高层建筑,引入雷达数据可能会进一步提高预测精度。建筑功能方面,分区模型优于组合模型,通过手动审核 SVIs 数据验证,88% 的建筑功能被正确分类。建筑质量和年龄的评估分别依赖于 Yolo-v8 模型和 GAIA 数据的准确性,通过手动标注 SVIs 数据验证,大部分建筑的质量问题和年龄能够被准确识别。
研究结论和讨论部分再次强调了 CMAB 数据集的重要意义。该数据集利用多源数据和集成机器学习,提高了三维建筑产品的精度;是首个利用开源数据快速获取全面建筑属性的全国性数据集,为建筑实例提供多属性信息;同时,手动创建的大量标注数据为进一步研究和应用奠定了基础。然而,研究也存在一些局限性,例如利用不透水表面确定建筑年龄可能导致估计略早于实际建设年份,未来研究人员计划纳入更准确的建筑年龄数据来提高准确性。
总体而言,CMAB 数据集的出现为城市研究和规划提供了强大的数据支持,有助于政策制定者和研究人员更好地理解中国建筑存量的物理结构和社会状态,为城市的可持续发展提供科学依据。随着技术的不断进步和研究的深入,相信这一数据集将在城市发展的各个领域发挥更大的作用。