OPEN VME:中东地区首个高分辨率卫星影像车辆检测数据集与全球基准CDSI的构建

【字体: 时间:2025年03月27日 来源:Scientific Data 5.8

编辑推荐:

  为解决卫星影像车辆检测中地理偏差导致的区域性能差异问题,卡塔尔计算研究所等团队构建了覆盖中东12国54城的VME数据集(4,282张图像,113,737个标注实例)和整合多源数据的全球最大基准CDSI(23,250张图像)。实验表明,基于VME训练的模型在中东地区mAP提升56.3%,CDSI使全球车辆检测性能提升19.6%-84.6%。该研究为智慧城市建设和灾害响应提供了重要数据支撑,发表于《Scientific Data》。

  

卫星影像中的车辆检测技术是智慧城市建设和应急管理的重要工具,但现有模型在应对全球多样化场景时表现参差不齐。尤其在中东地区,独特的建筑风格、快速城市化进程和特殊气候条件,使得基于欧美数据训练的检测模型频频"水土不服"。这种"地理盲区"现象背后,是现有数据集严重的地域不平衡——超过90%的标注数据来自北美和欧洲,而中东地区几乎成为算法世界的"失落之地"。

为打破这一技术壁垒,卡塔尔计算研究所Noora Al-Emadi领衔的国际团队开展了一项突破性研究。他们从Maxar公司获取高分辨率卫星影像,通过6000人规模的众包标注平台Co-one,构建了首个专注中东地区的车辆检测数据集VME(Vehicles in the Middle East)。这个包含4,282张512×512像素图像的数据宝库,精确标注了101,564辆汽车、5,327辆巴士和6,846辆卡车,所有目标均提供定向边界框(OBB)和水平边界框(HBB)双标注。更引人注目的是,团队整合xView、DOTA-v2.0等5个主流数据集,创建了全球规模最大的车辆检测基准CDSI(Car Detection in Satellite Imagery),涵盖23,250张图像和近110万标注实例。

关键技术方法包括:1)基于Maxar SecureWatch平台采集30-50cm/pixel高分辨率影像;2)采用众包+专家复核的混合标注策略;3)设计多源数据标准化流程,统一转换为MS-COCO格式;4)建立面积<400像素的车辆筛选标准;5)使用TOOD和DINO等先进检测模型进行基准测试。

VME数据集构建

研究团队从12个中东国家的54个城市采集影像,通过严格的质量控制(云覆盖率<20%,离天底角<30度)和半自动切片处理,最终获得4,282张有效图像。统计分析显示,所有汽车实例均属于MS-COCO定义的微小目标(面积<322像素),巴士和卡车则主要分布在小型目标范围(322-962像素)。这种目标尺寸分布为研究微小物体检测提供了理想样本。

CDSI基准创建

通过系统分析5个主流数据集的分类体系,团队建立了"汽车"与"其他小物体"的两级分类标准。关键创新在于引入400像素的面积阈值,有效过滤了标注噪声和超分辨率目标。最终构建的CDSI包含896,760个汽车实例,其中VME贡献了11.3%的数据量,显著提升了中东地区的表征比例。

性能验证

实验结果显示:在TOOD模型上,仅用VME数据训练的模型在中东测试集达到62.1% mAP50,较xView基线提升56.3%。更令人振奋的是,CDSI展现出强大的泛化能力——在DINO模型上,其全球检测性能较单一数据集最高提升84.6%。这表明数据多样性比单纯扩大规模更能提升模型鲁棒性。

这项发表于《Scientific Data》的研究具有三重里程碑意义:首先,VME填补了中东地区卫星检测数据的空白;其次,CDSI为全球车辆检测建立了新的黄金标准;最后,研究揭示的地理偏差现象为计算机视觉领域的公平性研究提供了重要案例。随着迪拜等中东城市加速推进智慧城市计划,这些数据集将成为城市规划者和AI研发者的宝贵资源,推动交通管理、灾害响应等关键应用的技术民主化进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号