ORBITaL-Net:面向全球尺度建筑特征提取的大规模标注训练库
《Scientific Data》:ORBITaL-Net: A labeled training library for large-scale building feature extraction
【字体:
大
中
小
】
时间:2025年10月19日
来源:Scientific Data 6.9
编辑推荐:
本刊推荐:为突破现有建筑提取训练数据在地理多样性和规模上的局限,Oak Ridge国家实验室团队构建了ORBITaL-Net开源数据集。该库包含来自72个国家、128,000个训练单元的149万建筑标注,涵盖多元地理环境、建筑结构和影像条件。研究证实,基于该数据训练的卷积神经网络(CNN)模型在阿拉伯半岛(310万平方公里)等区域实现单一模型高精度建筑提取,显著提升模型泛化能力,为全球尺度人居测绘和人口建模提供关键数据支撑。
随着高分辨率对地观测技术的迅猛发展,利用人工智能实现全球尺度建筑级测绘已成为可能。这项技术对应急响应、城市规划、气候变化研究等领域具有重大价值。然而,现有开源建筑标注数据集(如SpaceNet和ramp)主要集中于大型城市区域,缺乏地理多样性和建筑类型的全面覆盖,导致训练出的卷积神经网络(CNN)模型在面对全球复杂地理环境时泛化能力不足。
为攻克这一难题,Oak Ridge国家实验室的研究团队历时五年(2017-2021年),构建了名为ORBITaL-Net的大规模建筑特征提取训练库。该数据集覆盖全球72个国家,包含12.8万个500×500像素的训练单元和149万个手工标注的建筑轮廓,涉及约7,000平方公里的超高分辨率多光谱影像。与现有数据集相比,ORBITaL-Net特别注重纳入中低人口密度区域样本,涵盖多元建筑风格、土地利用类型和影像获取条件,从而更好地反映真实世界的复杂性。
研究方法的核心在于创新性地结合了多层次无监督聚类算法ISOSCELES进行代表性样本选择,以及严谨的人工标注流程。团队使用Maxar公司的WorldView-2/3等卫星影像(分辨率0.45-0.60米),通过30名分析师组成的专业团队,在GIS软件中严格按照建筑定义标准进行多边形数字化标注。质量控制包括三级审核机制:自查、互查和专家终审,确保标注的一致性和准确性。
ORBITaL-Net通过系统性地纳入不同建筑用途(住宅、商业、工业)、建筑材料(泥砖、钢材、木材、茅草)和建筑形状(方形/矩形、圆形、不规则)的样本,确保了训练数据的变异性。同时,数据集还包含了55-60%的无建筑负样本,这对降低模型误报率至关重要。影像获取条件的多样性也被充分考虑,包括不同的传感器视角和太阳高度角,这些因素直接影响建筑立面的可见度和阴影程度。
数据集的空间分布显示其覆盖了北美、南美、非洲、欧洲和亚洲的多样化地理环境。统计数据显示,建筑轮廓的面积、周长、复杂度和等参商数等几何特征均呈现较大变异性,反映了真实世界中建筑的形态多样性。按世界野生动物基金会(WWF)的生物地理分区和Koppen二级气候分区统计,建筑样本广泛覆盖了多种生态区和气候类型,确保了训练数据的环境代表性。
通过回顾性验证显示,随着训练数据量和多样性的增加,模型在9,500个全球分布验证样本上的性能持续提升。精确率(Precision)、召回率(Recall)和F1分数均呈现明显改善趋势,特别是精度和召回率比值的收敛表明模型学习了更稳定的预测函数。从早期项目区域(如朝鲜和也门)到当前基于完整数据集的全局基础模型,F1分数显著提高,证明数据集的扩展有效增强了模型的泛化能力。
建筑标注采用"所有可见部分"原则,包括立面和屋顶结构,这一定义针对人口建模应用场景优化。标注过程中,分析师通过调整影像属性(亮度、对比度、波段组合等)和专业判断,解决因建筑风格差异和复杂成像条件带来的挑战。图13展示了可接受的标注变异性,而图14则明确了不可接受的质量标准,这些标准被用于全数据集的质控。
研究证实,ORBITaL-Net数据集有效解决了地理空间人工智能(GeoAI)领域训练数据缺乏多样性的关键瓶颈。基于该数据集训练的全局基础模型在台湾、苏丹、乌克兰等多个地区无需微调即可直接应用,显著降低了新项目区域的标注成本。随着训练数据的扩展,模型适应新区域所需的工作量减少近半,证明了数据多样性对提升模型泛化能力的重要作用。
该研究的核心贡献在于构建了目前规模最大、地理多样性最丰富的开源建筑提取训练库,为开发稳健、可扩展的地理空间机器学习技术提供了重要基础设施。数据集已通过Figshare平台开放获取,包含384,810个文件(影像、标签和地理参考数据),预计将推动全球尺度人居环境测绘、灾害响应和可持续发展规划等领域的技术进步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号