青藏高原及周边地区首套矢量建筑屋顶数据集:基于AI Earth平台的高精度提取与应用

【字体: 时间:2025年06月18日 来源:Scientific Data 5.8

编辑推荐:

  本研究针对青藏高原及周边地区缺乏高精度建筑分布数据的难题,研究团队利用0.6米分辨率Google影像和AI Earth平台的双解码器分水岭算法,首次构建了覆盖6092.7 km2 、包含1309万栋建筑的矢量屋顶数据集。验证显示总体精度达87%,召回率91.9%,较CBRA数据集显著提升,为高原城镇化研究、灾害风险评估及光伏潜力测算提供了重要数据基础。

  

在全球气候变化与快速城镇化的双重背景下,被称为"世界第三极"的青藏高原正面临独特的人地关系挑战。这片平均海拔超过4000米的广袤区域,既是我国重要的生态屏障,又是地震、冰湖溃决等自然灾害频发的脆弱地带。然而,受制于地域辽阔、建筑分布稀疏等特点,该地区长期缺乏高精度建筑分布数据,严重制约了城镇化研究、灾害风险评估等关键工作的开展。

针对这一科学难题,北京师范大学地表过程与资源生态国家重点实验室联合青海师范大学等单位,在第二次青藏高原综合科学考察研究项目支持下,首次完成了青藏高原及周边地区矢量建筑屋顶数据的系统性提取。这项发表于《Scientific Data》的研究,通过融合0.6米分辨率Google Earth影像与阿里云AI Earth平台创新的双解码器分水岭算法,构建了覆盖西藏、青海等7省区、总面积达306万平方公里的建筑轮廓数据集。技术路线的核心创新在于:采用PointRend神经网络实现建筑边界的精细化分割,结合分水岭算法处理不同形态建筑,通过1km缓冲区预筛选将计算量减少86%,最终基于250个1km2
验证网格的149,035栋人工标注建筑进行精度评估。

研究结果显示:

  1. 数据规模与精度:数据集共提取13.09百万栋建筑,总面积6092.7 km2
    ,总体精度87%,召回率91.9%,F1分数64.8%,显著优于2.5m分辨率的CBRA栅格数据。
  2. 地理分异特征:通过K-means聚类将研究区划分为5类建筑密度区,其中高原腹地(I类区)虽提取精度最高(OA 94.6%),但因建筑与裸地光谱相似导致召回率最低(78.8%);而低海拔城市群(V类区)虽建筑密度最大,但受阴影干扰出现较多误判。
  3. 算法优势:相比传统Mask R-CNN,本方法在SpaceNet6竞赛中平均精度提升11个百分点,特别擅长处理藏式建筑特有的密集院落结构。

讨论部分着重指出:该数据集首次实现了高原建筑分布的"对象级"表征,突破了过去栅格数据无法描述建筑形态的局限。在应用层面,可为三方面研究提供支撑:① 高原特殊气候区建筑能耗模拟;② 地震灾害暴露人口精细化评估;③ 分布式光伏电站选址。研究同时坦承现存局限:约8%的偏远地区影像年代较早(最早至2001年),且高密度建筑群存在轮廓粘连现象,未来可通过引入边缘检测模块进一步优化。

这项工作的科学价值在于:建立了首个适用于高海拔复杂地形的建筑提取技术框架,其"先分区后验证"的精度评估方法为类似地区研究提供范式。数据已存储于国家青藏高原科学数据中心,将持续更新以支持"亚洲水塔"区域的可持续发展决策。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号