
-
生物通官微
陪你抓住生命科技
跳动的脉搏
非洲道路表面类型识别:基于Mapillary众包街景数据的大规模深度学习数据集构建与应用
【字体: 大 中 小 】 时间:2025年06月14日 来源:Scientific Data 5.8
编辑推荐:
本研究针对非洲地区道路表面类型识别数据匮乏的问题,开发了首个包含20万张Mapillary街景图像的标注数据集(分类为Paved/Unpaved/Unknown)。通过Swin Transformer等5种模型验证,分类准确率达0.924,在非洲6个10×10 km2 区域应用中指标超0.95。该成果为SDG 9.1.1评估及非洲交通基础设施优化提供了关键数据支持。
在非洲广袤的土地上,道路状况直接影响着经济发展与民生福祉。联合国可持续发展目标(SDG)9.1.1明确将"全年可通行道路"作为重要指标,但据研究显示,撒哈拉以南非洲70%的道路仍为土路,严重制约区域贸易与安全出行。传统道路检测依赖人工勘察或高分辨率遥感,前者效率低下,后者易受植被遮挡影响。尽管智能手机传感器和无人机技术有所突破,但缺乏大规模标注数据始终是深度学习模型应用的瓶颈。
中国地质大学(武汉)地理与信息工程学院周琦团队联合西北工业大学等单位,在《Scientific Data》发表了首个非洲道路表面类型众包数据集研究。团队通过Mapillary API获取非洲100×100 km2
网格的90万张街景图像,结合OpenStreetMap(OSM)道路标签筛选出70万张有效数据,最终由3名专家(Kappa=0.995)标注20万张图像构建三分类数据集。采用Swin Transformer等5种模型验证,最优模型在6个测试区域的分类指标普遍超过0.95。
关键技术包括:1) 基于OSM道路标签的空间匹配(阈值10米);2) 专家投票标注机制;3) 多模型对比(VGG-16/ResNet-50/Yolo v7/ConvNeXt/Swin Transformer);4) 非洲6个10×10 km2
典型区域验证。
数据记录
数据集包含20万张JPG格式街景图像及对应WGS84坐标的Shapefile点数据,空间分布如图4所示。
技术验证
场景1-模型训练
Swin Transformer以0.924准确率领先其他模型(表5),对Unknown类别的召回率达0.939,显示模型对低质量图像的强识别能力。
场景2-区域应用
在测试区域VI(纯土路区域)指标达0.999(表6),图5(f)直观展示分类结果与实际情况的高度吻合。
讨论与意义
该研究突破了三重局限:1) 首次实现众包街景数据的大规模道路分类;2) 验证了标注数据对跨区域应用的泛化性;3) 为OSM标签纠错提供自动化方案。值得注意的是,数据集中在沥青/土路主导的非洲场景,未来可扩展混凝土等复杂类型。尽管存在城乡覆盖偏差,但Mapillary的持续更新特性为数据优化留有空间。
研究成果直接服务于SDG 9.1.1评估体系,其方法论可推广至Google Street View等其他平台。正如作者指出,这套技术路径不仅能绘制非洲道路表面图谱,更能通过"数据反哺"机制完善OSM标签系统,形成可持续发展的数据生态。
生物通微信公众号
知名企业招聘