编辑推荐:
为解决 DAS 系统中事件准确分类难题,研究人员开展基于 Φ-OTDR 技术的 DAS 系统事件分类研究,构建含行走、车辆移动等事件的标注数据集,用 CNN 验证其质量,为机器学习模型开发提供资源,推动 DAS 技术应用。
在基础设施监测与安全防护领域,分布式声波传感(Distributed Acoustic Sensing, DAS)技术凭借光纤对长距离声信号的高分辨率捕捉能力,在地震监测、结构健康监测等场景展现出巨大潜力。然而,该技术面临高维噪声数据处理与事件精准分类的瓶颈:传统信号处理方法难以从复杂振动信号中提取有效特征,且公开高质量数据集匮乏,制约了机器学习模型的开发与验证。在此背景下,布尔诺科技大学(Brno University of Technology)的研究团队围绕 DAS 系统的事件分类展开研究,相关成果发表于《Scientific Data》,为该领域提供了关键数据支撑与技术参考。
研究团队采用基于相位敏感光时域反射(Φ-OTDR14)技术的 Optasense ODH-F DAS interrogator 系统,对埋设于校园地下 1 米的单模光纤链路进行监测。数据采集于 2023 年 4 月晴朗天气下完成,避免了环境噪声干扰,共记录行走、跑步、车辆行驶等日常活动,以及围栏攀爬、光纤篡改、井盖启闭等潜在安全威胁事件。
关键技术方法
- 数据采集与系统配置:利用 Φ-OTDR 技术,以 20 kHz 脉冲重复率、20 ns 激光脉冲宽度及 1 米空间采样间隔采集信号,覆盖 1663 个通道,实现对光纤沿线振动事件的高时空分辨率捕捉。
- 数据标注与特征处理:通过带限信号功率(Pband)计算与人工标注,生成含事件位置信息的位图文件(.npy 格式),结合快速傅里叶变换(FFT)过滤噪声信号,确保标注数据的准确性。
- 模型验证:采用卷积神经网络(CNN)模型,通过 80:10:10 的训练 - 验证 - 测试数据划分,验证数据集质量,模型最终实现 91.4% 的分类准确率。
研究结果
1. 数据集构成与标注
数据集包含汽车(20957 例)、施工(29169 例)、围栏活动(3601 例)等 9 类事件,以 HDF5 格式存储原始信号,搭配 JSON 元数据与 NumPy 位图文件。例如,汽车行驶的Pband呈现特定频段能量集中特征,而施工活动则表现为宽频能量分布,步行事件以间歇性能量脉冲为典型(图 3)。
2. 技术验证与模型性能
CNN 模型通过两层卷积层(64/256 个滤波器)与两层全连接层(1024/7 个神经元)架构,对经汉宁窗分帧(8192 样本 / 窗,2048 样本重叠)与过采样 DFT 处理的频域信号进行训练。测试结果显示,模型宏平均精度 85.7%、召回率 88.2%、F1 分数 86.8%,证明数据集具备良好的事件特征区分度。
3. 应用拓展与数据价值
除事件分类外,该数据集可用于深度学习特征提取研究。基于迁移学习理念,校园场景训练的模型有望快速适配城市中心等其他环境,降低跨场景应用的再训练成本。
研究结论与意义
本研究构建了首个公开的 DAS 系统事件分类综合数据集,填补了领域数据缺口。通过 Φ-OTDR 技术与 CNN 模型的结合,验证了数据驱动方法在复杂振动信号解析中的有效性,为地震预警、管道安全、公共区域安防等领域提供了可复用的研究工具。未来,该数据集可进一步推动无监督学习、实时监测算法的开发,助力 DAS 技术从实验室走向更广泛的实际应用场景,提升关键基础设施的智能化监测水平。