《Engineering Applications of Artificial Intelligence》:A few-shot enhancement method for railway foreign object detection using sample generation and transfer learning
编辑推荐:
针对铁路异物检测中样本不足的问题,提出基于样本生成与三阶段迁移学习的FS-RFOD方法。通过数据增强构建铁路 few-shot 数据集,并设计基础训练、增强训练和微调的三阶段迁移学习框架,实验表明在10样本量下mAP50达85.4%,Recall达84.0%,优于现有方法。
Hang Yu | Zhiwei Cao | Yong Qin | Tiantao Xu | Tao Jing | Zhenlin Wei
北京交通大学先进铁路自主运行国家重点实验室,北京,100044,中国
摘要
—异物检测是确保铁路运营安全最重要的部分之一。随着人工智能(AI)技术的发展,基于深度学习的铁路异物检测方法取得了巨大进展。然而,当训练样本不足时,它们的检测性能会显著下降。为了解决这个问题,我们提出了一种利用样本生成和迁移学习(FS-RFOD)的少样本增强方法来进行铁路异物检测。首先,我们提出了一个少样本物体检测框架,可以有效提高铁路场景中异物检测的准确性。其次,我们构建了一个铁路少样本数据集,使用异物生成和图像风格转换方法进行数据增强。第三,我们提出了一种新的三阶段迁移学习方法来增强少样本物体检测的效果。实验结果表明,FS-RFOD在平均精度(mAP50)和召回率方面均优于现有最先进算法,分别达到了85.4%和84.0%。
引言
随着铁路速度和运输里程的增加,铁路安全已成为铁路系统的首要关注点(Qin等人,2023a)。异物是铁路环境中的主要潜在风险。一旦异物入侵,不仅会威胁列车运营的安全,还会造成巨大的经济损失。因此,铁路场景中的异物检测具有重要的实际意义。
铁路异物检测可以分为传统算法、基于机器学习的算法和基于深度学习的算法。在传统方法中,使用光流(Ruder等人,2003)、帧差(Oh等人,2007)和背景差(Zivkovic,2004)进行物体检测。这些方法检测速度快,但容易产生大量误报。基于机器学习的算法通常需要选择和设计手工特征,然后与支持向量机(Tong等人,2012)和Adaboost(Toprak等人,2018)等分类器结合使用。虽然这些方法可以通过整合多源信息来提高检测准确性,但在复杂场景中的泛化能力较差。随着深度学习的发展,Faster R-CNN(Ren等人,2017)、YOLO(Redmon等人,2016)和SSD(Liu等人,2016)等算法已被应用于铁路异物检测,并取得了有希望的结果(Cao等人,2022;Ye等人,2022)。然而,当样本量不足时,这些算法的有效性会受到限制。例如,如图1所示,悬挂在接触网上的轻质漂浮物体在铁路中较为罕见,难以检测。尽管这些物体对铁路安全构成严重威胁,但很少有研究关注铁路场景中的少样本异物检测。因此,迫切需要开发一种用于铁路异物检测的少样本增强方法。
在复杂的铁路环境中,铁路少样本异物的检测面临许多挑战(Cao等人,2024)。首先,铁路在开放环境中运行,各种异物都可能入侵。还有一些罕见的异物会对安全构成严重威胁,例如悬挂在接触网上的塑料薄膜。其次,物体检测算法依赖于大量数据才能获得良好的准确性和泛化能力。第三,少样本物体检测方法需要进一步改进,因为它们难以从小数据集中构建出鲁棒的特征,这容易导致模型过拟合。
为了解决这些问题,我们提出了一种利用样本生成和迁移学习的铁路异物检测少样本增强方法,称为FS-RFOD。在这种方法中,我们提出了一个铁路少样本异物检测框架,可以有效地检测复杂铁路场景中的少样本异物。随后,我们采用样本生成方法生成高质量样本并构建了一个铁路少样本异物数据集。此外,通过迁移学习方法,FS-RFOD实现了高检测准确性和良好的泛化性能。本文的贡献如下:
- 1)
我们提出了一个铁路少样本异物检测框架,利用样本生成和迁移学习提高了铁路少样本异物检测的准确性和泛化能力。
- 2)
我们使用样本生成方法构建了一个铁路少样本异物数据集,弥补了数据稀缺的问题,并为少样本特征构建提供了基础。
- 3)
我们提出了一种三阶段迁移学习方法TsTL,包括基础训练、增强训练和微调训练阶段,实现了有效的学习和少样本特征的构建。
- 4)
在铁路少样本异物数据集上进行了实验,FS-RFOD在10个样本设置下的平均精度(mAP50)达到了85.4%,召回率为84.0%,优于现有方法。
章节片段
铁路异物检测
近年来,许多基于深度学习的铁路异物检测方法被提出,逐渐取代了传统算法,具有更高的检测准确性(He等人,2021;Wu等人,2022;Lian等人,2025)。Cao等人(2022)设计了一种使用动态入侵区域的铁路入侵检测方法,准确率为96.90%,误报率为0.24%。I. Mahmud等人(2023)使用Mask R-CNN(He等人,2017)算法检测铁轨
方法论
在第3.1节中介绍了FS-RFOD的总体框架。第3.2节描述了用于构建铁路少样本异物数据集的样本生成方法。第3.3节介绍了一种新的三阶段迁移学习方法。第3.4节介绍了本文构建的两个少样本数据集。第3.5节提供了实验的详细信息。
实验结果
在本节中,我们展示了所提出方法的优越性。首先,我们将提出的FS-RFOD与现有最先进方法在铁路数据集上进行了比较。然后,我们在PASCAL VOC数据集上进行了对比实验,以验证所提出方法的泛化能力。最后,我们评估了现有算法相对于所提出方法的适应速度。
数据增强和TsTL的效果
本节通过评估单阶段、两阶段和三阶段训练范式,对数据增强策略和提出的三阶段迁移学习(TsTL)方法的效果进行了比较分析。所有实验均使用Faster R-CNN-FPN框架进行,结果总结在表VII中。这里,Db、De和Df分别表示基础数据集、增强数据集和微调数据集。
实验结果清楚地表明
结论
本文提出了一种用于铁路异物检测的少样本增强方法。首先,我们提出了一个铁路少样本异物检测框架,通过使用样本生成和迁移学习方法增强了数据和训练策略。其次,我们构建了一个铁路少样本数据集,以解决铁路异物数据不足的问题。最后,我们提出了一种三阶段迁移学习方法,以提高铁路检测的准确性和泛化能力
CRediT作者贡献声明
Hang Yu:撰写——原始草案、可视化、验证、软件、方法论、调查、数据整理。Zhiwei Cao:撰写——审稿与编辑、监督、方法论、概念化。Yong Qin:监督、资源管理、项目申请、概念化。Tiantao Xu:调查、数据整理。Tao Jing:概念化。Zhenlin Wei:监督、调查。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
本工作得到了CPSF博士后奖学金计划(项目编号:GZC20251118)和国家重点研发计划(项目编号:2023YFB3211103)的支持。