
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向资源回收的建筑与拆除废弃物类别分割基准数据集CDW-Seg:真实杂乱场景下的自动化处理新突破
【字体: 大 中 小 】 时间:2025年05月29日 来源:Scientific Data 5.8
编辑推荐:
本研究针对建筑与拆除废弃物(CDW)管理中缺乏高质量公开数据集的问题,开发了首个真实场景下的多类别分割基准数据集CDW-Seg。该数据集包含430张高分辨率图像,涵盖10类常见废弃物,通过语义分割标注5,413个对象(总计24.9亿像素)。研究团队采用适配器微调的层次化视觉Transformer(hiera-ViT)模型验证数据集有效性,实现平均精度0.80和加权交并比(WIoU)0.73。该成果为自动化废弃物处理系统开发提供了关键数据支撑,推动资源回收领域的计算机视觉应用。
在全球城市化进程加速的背景下,建筑与拆除废弃物(CDW)已占固体废弃物总量的40%,其不当处理导致土地退化、温室气体排放和资源浪费。当前废弃物分拣主要依赖人工,存在效率低、成本高、安全隐患等问题。虽然计算机视觉技术为自动化分拣提供了可能,但缺乏真实场景下的高质量数据集制约了技术发展。现有数据集多采集于受控环境(如传送带或称重桥),难以反映实际工地杂乱场景中废弃物堆叠、遮挡和光照变化的复杂性。
为解决这一瓶颈,莫纳什大学的研究团队开发了CDW-Seg数据集,相关成果发表于《Scientific Data》。该研究通过标准手机摄像头采集430张工地现场图像,涵盖混凝土、木材、金属等10类常见废弃物,采用Labelme工具进行像素级标注。为验证数据集实用性,研究采用冻结预训练hiera-ViT编码器、仅微调适配器层的策略,在保持模型性能的同时将可训练参数降至1.75%(3.94M/225.4M),适合资源受限的物料回收设施(MRF)部署。
【数据来源】
图像采集自墨尔本真实工地,包含俯视、斜角和侧视等多视角,模拟MRF监控系统的实际观测条件。原始图像分辨率3000×4000像素,单张标注平均耗时25分钟,最终形成Pascal VOC和COCO两种格式的标注文件。
【数据处理】
通过语义分割生成彩色编码的像素级掩膜,黑色区域表示未标注部分。数据集按75:15:10划分为训练集、验证集和测试集,类别分布分析显示混凝土(24.3%)、填土(18.7%)和木材(15.2%)占比最高。
【技术验证】
采用SAM2模型架构,其hiera-ViT-large编码器在10类废弃物分割中表现优异:混凝土(精度0.86)、木材(0.83)等材质规则的对象识别最佳,而钢材(0.71)和硬塑料(0.69)因表面反光特性识别较差。混淆矩阵显示主要误判发生在混凝土与填土(12%)、硬塑料与钢材(11%)等视觉相似类别间。定性分析显示模型能准确分割多数对象,但对潮湿填土与混凝土的区分、反光纸板与金属的鉴别仍需改进。
【数据记录】
数据集包含三个模块:原始图像与JSON标注文件、Pascal VOC格式的语义/实例分割掩膜、以及符合COCO标准的annotations.json文件。所有数据可通过Figshare获取(DOI:10.6084/m9.figshare.28573229)。
该研究创建了首个真实场景下的CDW细分基准数据集,其创新性体现在三个方面:一是填补了杂乱环境下废弃物分割数据的空白,二是验证了适配器微调策略在资源受限场景的适用性,三是公开标注数据促进跨模型比较。实际应用中,该数据集可支持机器人分拣系统开发,预计将人工分拣效率提升3-5倍。未来研究可结合多模态传感(如深度相机)进一步区分视觉相似材料,或探索半监督学习以降低标注成本。这项成果为建筑业的循环经济发展提供了重要的技术基础设施。
生物通微信公众号
知名企业招聘