FaultSeg 数据集:开启铁路车轮缺陷智能检测新时代,筑牢运输安全防线

【字体: 时间:2025年02月21日 来源:Scientific Data 5.8

编辑推荐:

  为解决铁路车轮缺陷检测难题,某大学研究人员开展 FaultSeg 数据集用于车轮缺陷检测研究。结果显示该数据集训练的 YOLOv9 模型准确率约 87%。此研究为铁路运输安全保障提供新途径,强烈推荐科研读者阅读。

  
在交通的大舞台上,铁路运输凭借着速度与便捷,成为运输网络中不可或缺的重要角色。它不仅为人们的出行提供了高效选择,还在经济发展中发挥着关键作用,与公路、航空、海运等运输方式相比,铁路运输往往是更具性价比的选择。

然而,铁路运输的安全保障离不开其基础设施的稳固。车轮,作为铁路基础设施中至关重要的滚动部件,肩负着承载列车重量、维持车厢平衡和推动列车前行的重任。但在日复一日的高强度工作中,车轮面临着严峻的挑战,各类故障时有发生。就像一个不知疲倦的战士,在长期的战斗中难免会受伤。

这些故障中,裂缝、剥落、变色最为常见。裂缝的出现,是因为金属材料结构在热应力或疲劳的作用下被削弱,就如同坚固的城墙出现了裂痕;剥落则是车轮与轨道不断摩擦产生疲劳的结果,小范围的严重损伤可能会影响整个车轮的几何形状,甚至引发列车脱轨这样的严重事故;变色是金属表面过热的 “信号”,而划痕则是轨道上的碎屑造成的 “伤痕”。据相关研究显示,相当比例的运营车轮存在这些问题,28% 的车轮有小裂缝,15% 有明显的剥落问题,20% 因过热出现变色,10% 和 12% 的车轮存在平点或划痕 。

为了保障铁路运营的安全与可持续性,对车轮进行持续的状态监测至关重要。传统的监测方法主要依靠人工定期检查,就像是人工给车轮 “体检”。一组专业人员需要仔细查看每个车轮,不放过任何可能存在的问题。每隔三到八年,还会进行更详细的评估,此时整列火车要 “停工”,前往维修设施进行全面检查。但这种方法存在诸多弊端,成本高、耗时长,而且人工检查容易受到疏忽或疲劳的影响,导致误判。在一些发展中国家,铁路基础设施和运输质量相对较低,列车事故频发,就像巴基斯坦,过去五年共发生了 537 起重大事故,造成了大量人员伤亡。

在这样的背景下,深度学习(DL)技术的发展为铁路车轮故障监测带来了新的希望。它在多个领域的状态监测和预测维护中都展现出了强大的能力,在铁路车轮故障监测方面,也有不少研究尝试利用它实现半自动化或全自动化监测。有的研究通过振动分析、声学信号识别来检测故障,有的结合传感器与 DL 技术,还有的利用图像处理技术进行故障诊断。但目前还没有一个公开可用的基于图像分割的车轮缺陷检测基准数据集,这成为了进一步提升故障检测准确性和效率的 “绊脚石”。

为了解决这些问题,某大学的研究人员在《Scientific Data》期刊上发表了名为《FaultSeg: A Dataset for Train Wheel Defect Detection》的论文。他们的研究成果意义重大,通过创建 FaultSeg 数据集,为深度学习模型的发展提供了有力支持,有望实现车轮缺陷的自动检测,从而保障铁路运营的安全与高效。

在这项研究中,研究人员主要运用了以下关键技术方法:
首先是数据收集技术,他们设计了一套路边检测系统,在系统上安装多个 GoPro Hero 9 相机来采集数据。为了确保数据的全面性和准确性,相机被固定在特定的高度和距离拍摄,同时运用了多种数据增强技术,如随机旋转、平移和翻转等,以弥补视角的局限性。其次是数据预处理技术,对收集到的图像进行自动定向、调整大小、对比度拉伸等操作,还对少数缺陷类别的图像进行数据增强,并调整损失函数中的类权重,让模型对较少出现的缺陷更敏感。最后,利用 YOLOv9 实例分割模型对数据集进行训练和评估,通过精确率、召回率、F1 分数以及混淆矩阵等指标来验证模型的性能。

下面来看看具体的研究结果:

数据收集


研究人员将精心设计的路边检测系统安装在了巴基斯坦繁忙的 Kotri 火车站的运营轨道上。在数据收集过程中,他们面临着诸多挑战,要确保团队和乘客的安全,还需要获得政府和铁路部门的官方批准,并且要根据列车时刻表在规定时间内完成设备安装。经过连续多日的努力,他们记录了大量不同长度的视频,这些视频分辨率高达 2704×1520,帧率为 24FPS 。经过一系列筛选和处理,最终从这些视频中挑选出 829 张高分辨率图像用于后续研究。在标注环节,他们与铁路部门合作,使用 Roboflow 工具对图像进行手动标注,标注的缺陷类别包括裂缝 / 划痕、剥落和变色,并将标注结果以多种格式保存,如 TXT、XML、JSON、CSV 和 tfrecord ,为后续研究提供了丰富的数据基础。

数据记录


FaultSeg 数据集包含 1872 帧图像,其中 829 帧进行了缺陷标注。这些图像由安装在轨道同一侧的三个相机拍摄,能够完整呈现车轮的状况。数据集的图像和标注标签按照树状结构组织在一个存储库中,方便研究人员访问。该数据集可用于开发和评估深度学习模型,并且已在 Zenodo 和 Figshare 等开放平台上发布,还提供了详细的用户指南,为全球的研究人员、工程师和铁路行业从业者提供了宝贵的数据资源。

技术验证


研究人员对 FaultSeg 数据集进行了全面的技术验证。在数据可用性验证方面,他们将数据集划分为训练集、测试集和验证集,使用 799 张图像训练 YOLOv9 - seg 模型,并通过 20 张未见过的车轮样本图像进行验证。在模型验证中,运用精确率、召回率、F1 分数和混淆矩阵等指标进行评估。结果显示,该模型在各个类别上都表现出色,尤其是对车轮和变色缺陷的检测。通过与以往研究的对比,FaultSeg 数据集的优势明显,它提供了高分辨率图像和多种缺陷类型标注,图像数量也较为丰富,为实际铁路维护中的缺陷检测提供了更可靠的依据。

研究人员在论文的结论和讨论部分指出,FaultSeg 数据集的创建是铁路车轮缺陷检测领域的重要突破。它能够有效训练深度学习模型,显著提高检测准确性,同时减少人工检查所需的时间和成本,为铁路运输的安全和高效运行提供了有力保障。在实际应用中,该数据集可用于训练检测模型、开发自动化检测系统、优化资源分配、确保合规性和安全性,还能作为评估其他模型性能的基准数据集。

不过,FaultSeg 数据集也存在一些局限性。比如,数据集中存在类别不平衡的问题,某些缺陷类别的实例数量较少,这可能会影响模型的性能;图像采集的视角和条件有限,可能无法涵盖所有实际情况;虽然图像分辨率较高,但仍有部分缺陷难以通过普通图像检测出来。针对这些问题,研究人员提出了未来的改进方向,包括扩大数据采集的范围,涵盖更多不同的条件、地点和缺陷类型;引入热成像或超声波成像等额外的数据来源,以检测普通图像难以发现的缺陷;建立标准化的基准,便于比较不同模型的性能;加强研究人员之间的合作,让 FaultSeg 数据集能够更广泛地被使用,推动铁路维护解决方案的快速发展。

总的来说,这项研究为铁路车轮缺陷检测开辟了新的道路,FaultSeg 数据集的出现就像是为铁路运输安全注入了一针 “强心剂”,虽然目前还存在一些小问题,但随着后续研究的不断深入和改进,必将为全球铁路运输的安全与稳定发挥更大的作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号