基于领域知识与多源数据的明清历史建筑多细节层次语义三维建模方法Shp2gml研究

【字体: 时间:2025年10月13日 来源:International Journal of Digital Earth 4.9

编辑推荐:

  本文提出了一种创新的语义三维建模方法Shp2gml,旨在解决明清历史建筑在数据获取受限条件下(如无人机限制、遗产保护政策)的多细节层次(LoD)模型生成难题。该方法深度融合领域知识与深度学习,整合建筑轮廓、立面影像和非结构化网络文本等多源数据,实现了从LoD0到带纹理LoD3的语义模型自动生成。实验表明,该方法在命名实体识别(NER)任务中关键实体准确率超过80%,屋顶类型识别准确率达100%,门窗完整性提升至83%,显著优于现有模型,为文化遗产数字化、三维地理信息系统(3D GIS)分析和智慧城市应用提供了高效可靠的技术方案。

  
摘要
明清历史建筑作为中国文化遗产的关键组成部分,以其精湛工艺和独特空间布局闻名。然而,无人机限制和遗产保护政策往往限制了全面三维数据的获取。为此,研究提出了shp2gml方法,一种在数据受限条件下整合建筑轮廓、立面影像和非结构化网络文本的语义三维建模方法。该方法结合领域知识与深度学习从多源数据中提取建筑特征,通过分析建筑特性和应用领域特定规则,设计建模算法生成语义三维模型。实验证明,shp2gml能够产生从LoD0到带纹理LoD3的模型,在NER任务中总体F1分数达到78%,关键实体准确率超过0.80。与现有模型相比,屋顶类型准确率达到100%,门窗完整性提升至83%,展示了其在文化遗产建模和基于GIS应用中的有效性。
1. 引言
明清时期的历史建筑构成了中国文化遗产的关键部分。这些建筑不仅体现了先进的建筑工艺和复杂的空间组织,还承载了丰富的社会功能和历史价值。由于明清时期持续时间长且相对近代,大量建筑遗存得以保存。在国家重点文物保护单位中,古代建筑是最大的类别,其中明清建筑尤为突出。这些建筑群通常保存完好,采用木框架系统、严谨的轴线布局和深厚的文化内涵,成为城市文化遗产的重要载体。
在文化遗产保护、城市规划和应急管理等领域,具有多细节层次(LoD)的历史建筑语义三维模型为建筑结构的数字化记录和表示提供了关键支持。例如,在应急管理中,LoD1块模型能够快速评估建筑占用情况,促进洪水模拟、灾害评估和疏散路线分析。在文化遗产保护和虚拟旅游中,三维模型不仅支持遗产对象的几何建模和属性检索,还记录其历史演变、损坏状况和保护状态,促进遗产信息与时空数据的整合以及跨平台应用。
当前,城市三维模型获取主要依赖主动或被动传感器以及现场测绘,包括机载激光雷达(LiDAR)、车载移动测量系统(MMS)、无人机摄影测量和地面测量。尽管这些方法在现代城市建模中表现出高效率和精度,但在生成明清历史建筑群的三维模型时仍面临限制。传统三维数据获取方法在建模明清历史建筑群时面临诸多挑战。由于这些建筑群通常位于市中心,传统测量技术受到无人机禁飞政策、遗产保护法规和游客管理规则的限制。此外,复杂地形和严重遮挡也阻碍了完整三维数据的获取。
尽管近年来历史建筑三维建模取得了显著进展,但在生成语义丰富、结构连贯的三维语义模型方面仍存在研究空白。细节层次(LoD)层级为历史建筑的高精度、多尺度表示提供了可行途径。现有研究主要依赖立面影像作为单一数据源,采用几何分析结合程序化建模技术(如形状语法)来自动化立面重建,或生成多个设计假设以捕捉历史重建中的不确定性。然而,由于数据范围受限,这些方法难以整合异构源(包括轮廓、图像和文本文档),因而无法系统表示历史建筑的基础层级语义。
近期研究开始探索语义驱动框架和深度学习-摄影测量流水线用于建筑三维建模。然而,这些方法主要针对当代城市建筑,尚未严格适应历史建筑复杂的形态、风格演变和文化语义。因此,遗产建筑的语义三维建模迫切需要多源数据融合、实体级语义识别和层级结构表示方面的突破。
为应对这些挑战,本文提出了shp2gml,一种利用领域知识和多源数据生成明清历史建筑语义三维模型的方法。通过整合领域知识和机器智能,该方法从公开可用的多源数据中提取地理空间坐标、几何参数、属性信息和外观纹理,在三维数据获取有限的条件下生成具有多LoD的语义三维模型。
2. 方法论
本研究借鉴智能测绘中提出的混合智能计算范式,遵循知识-数据-算法-服务(KDAS)策略——以知识(K)为指导,数据(D)为驱动,算法(A)为基础,服务(S)为支撑。目标是融合多源数据与领域知识,生成明清历史建筑的多LoD语义三维模型。工作流程包括四个主要部分:
首先,在领域知识指导下提取历史建筑信息:总结GIS和建筑遗产科学等领域的领域知识,从多源数据中提取历史建筑的地理信息、几何参数、外观纹理和属性信息。包括从历史建筑轮廓中提取真实地理空间坐标,通过历史建筑立面图像计算建筑组件的几何参数,以及从非结构化网络文本中提取丰富的属性信息。
其次,生成具有多LoD的历史建筑语义三维模型:基于历史建筑的屋顶特征和对称性等领域知识,设计算法生成符合CityGML标准的LoD0至LoD3语义三维模型。
第三,纹理坐标计算与映射:通过历史建筑立面图像和领域知识,提取建筑组件的像素坐标,计算相应的纹理坐标,并将真实纹理映射到历史建筑的三维模型上。
第四,在线服务系统构建:通过遥感图像和数字高程模型(DEM)生成三维地形,结合历史建筑三维模型,构建遗产区域的三维实景,开发基于三维实景的明清历史建筑知识服务原型系统,提供三维场景漫游、语义查询、智能在线问答等在线服务。
2.1. 使用多源数据的历史建筑信息提取
2.1.1. 领域知识指导的历史建筑地理空间信息提取
中国历史建筑通常具有宽大的屋顶和屋檐。基于这一领域知识,研究提出假设:历史建筑的轮廓代表建筑最外层屋檐轮廓在地面上的投影。从OpenStreetMap(OSM)的建筑轮廓中,可以提取代表历史建筑最外层屋檐轮廓顶点的地理空间坐标。通过投影变换(如UTM投影),将地理坐标(纬度、经度)转换为特定的投影坐标系中的直角坐标(X, Y),单位为米。
2.1.2. 基于立面图像的歷史建築組件提取
对于历史建筑,轮廓通常仅提供二维信息;立面图像则补充垂直尺寸并揭示组件关系。在理想成像条件下(正交视图、最小透视畸变),像素尺寸与实际尺寸成比例。基于这一特性,图像通过单应性变换进行校正以消除透视畸变。从轮廓数据中获得的屋顶宽度提供了全局比例因子,用于将墙壁、屋顶、门和窗的像素尺寸转换为公制单位,从而获得准确的组件尺寸。
2.1.3. 基于深度神经网络的历史建筑信息提取
为促进从非结构化文本中识别历史建筑实体和提取相关属性,开发了一种基于深度学习的方法。首先通过网络爬虫从官方网站收集历史建筑的描述性文本,进行预处理后人工标注以构建训练数据集。基于该数据集,采用预训练语言模型获取文本的高维向量表示,训练BERT-BiLSTM-CRF架构,以提取关键实体和属性,如建筑名称、别名、屋顶类型和建造时期。提取的属性根据后续应用进行分类:名称作为链接轮廓和属性的键;屋顶类型指导LoD2/LoD3屋顶生成;其他属性作为语义属性嵌入CityGML的CityObjects中以支持查询操作。
2.2. 历史建筑多LoD语义三维模型的生成
细节层次(LoD)在BIM和GIS中广泛用于以不同精度级别表示对象,优化可视化和计算效率。本研究遵循CityGML标准生成历史建筑的多LoD表示,同时融入历史建筑的独特特征:
  • LoD0:以三维地理空间坐标表示的轮廓平面。
  • LoD1:包含高度信息的挤出三维体量,用于大规模场景表示。
  • LoD2:包含屋顶几何形状的模型,捕捉历史建筑屋顶的结构特征。
  • LoD3:具有明确门窗表示的精细模型,支持噪声分析、洪水模拟和应急管理等应用。
  • 带纹理的LoD3:带有纹理的增强型LoD3模型,准确再现历史建筑的详细外观。
2.2.1. LoD0和LoD1模型的生成
LoD0和LoD1模型均根据2.1节所述的数据集生成。当数字高程模型(DEM)不可用时,轮廓顶点被分配默认的地面高程0米;否则,使用每个顶点位置对应的DEM高度,从而产生LoD0模型。建筑高度从立面图像推断:提取并简化建筑轮廓,其最高和最低像素之间的差值提供像素高度,同时测量屋顶的像素宽度。比例因子定义为图像中屋顶像素宽度与轮廓中屋顶宽度的比值,用于将像素高度转换为度量高度。通过为轮廓顶点分配(i)地面高程(来自DEM或默认0米)和(ii)估计的建筑高度,获得两组具有不同高程的三维坐标。合并由这些坐标形成的多边形产生历史建筑的最小边界立方体——其LoD1模型。
2.2.2. LoD2模型的生成
与LoD1模型相比,历史建筑的LoD2模型包含了屋顶结构,这些结构通常很复杂,包括功能性和装饰性组件,如屋脊、坡面、屋檐和脊饰。研究总结了九种具有代表性的屋顶样式及其结构特征。为了平衡形态保真度和计算效率,对屋顶几何形状进行了适当简化。采用2.1.3节所述的方法,直接从描述性文本源中提取每个建筑的屋顶类型,并基于屋顶结构特征生成屋顶几何模型。此过程不涉及任何分类器或决策树,也不需要分类或推理,而是基于语义内容直接获取属性值。
LoD2模型生成过程首先从建筑轮廓确定基础顶点坐标。然后,使用立面图像结合比例因子(源自像素到度量的对应关系)和从文本中提取的屋顶类型参数计算屋顶顶点坐标。这些坐标然后根据几何连通性组装成多边形屋顶表面。每个屋顶表面被分配语义标签,如屋顶类型、坡度和结构元素。最后,这些屋顶多边形的顶点坐标按顺序写入CityGML文件,从而形成具有几何和语义的完整LoD2建筑模型。
2.2.3. LoD3模型的生成
LoD3模型提供比LoD2模型更高的细节,支持高级模拟,如噪声传播和洪水分析。对于历史建筑,LoD3模型是通过从立面图像中识别和分割门窗并将这些元素集成到LoD2模型中生成的。基于历史建筑的知识,传统中国历史建筑中的门窗可以简化为具有一定规则的、与墙壁处于同一平面的多边形。因此,计算这些元素的三维坐标的任务可以简化为二维平面坐标计算。首先,从LoD2模型的墙壁顶点计算墙壁的平面方程。然后,从立面图像中提取从墙壁右下角顶点到门窗顶点的像素距离。这些像素距离使用比例因子转换为现实世界坐标,生成这些元素的多边形表示。
当某些立面无法获得立面图像时,捕捉门窗的分布变得具有挑战性。为了解决这个问题,利用了历史中国建筑的对称性。传统中国建筑,尤其是宫殿和寺庙,强调沿中轴线的双侧对称,以确保秩序和层次。基于这一领域知识,假设不可见立面与可用立面对称,允许部分立面图像(正面、一侧和背面)重建完整的三维结构。对于具有金字塔屋顶的建筑,仅需要正面和一侧图像即可生成整体模型。使用这种基于对称性的方法,即使在立面图像数据不完整的情况下,也可以构建LoD3语义三维模型。
2.2.4. 通过纹理映射增强语义三维模型
立面图像对于提取结构元素(如墙壁、屋顶、门和窗)以及保留建筑物的真实外观至关重要。将这些纹理纳入语义三维模型中,通过添加颜色和图案细节来增强视觉真实感,而无需增加几何复杂性,确保真实感和计算效率之间的平衡。此外,纹理信息有助于建筑研究、保护和修复。
本研究从立面图像中提取建筑组件的像素坐标,并计算其纹理坐标以实现真实的纹理映射。由于图像来自互联网,可能会部分遮挡建筑物体(如行人)。必要时使用基于人工智能的技术去除此类遮挡。识别出的建筑轮廓(如屋顶、门、窗)被提取并简化为多边形,通过翻转y轴将顶点坐标从像素空间计算并变换到笛卡尔坐标系。然后通过将像素坐标除以图像尺寸来计算归一化纹理坐标。最后,解析GML文件,并将纹理坐标嵌入到相应的CityObject元素中,从而实现带纹理的语义三维模型的生成。
3. 实验与结果
3.1. 研究区域
中国历史建筑以其独特的风格和历史为特征。故宫作为明清两代的皇家宫殿,代表了传统中国建筑的顶峰,以其宏大的规模、复杂的布局和精致的工艺为特点。作为世界遗产地,它具有巨大的历史和文化意义,为研究提供了丰富的多源数据。因此,本研究选择故宫作为研究区域以验证所提出的方法。本研究使用的数据完全来自公开可用的平台。轮廓从OpenStreetMap获取,而立面图像则从各种在线来源收集,包括旅游网站和百科页面。由于这些立面图像是从网络爬取的,必要的外部
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号