基于分布式声波传感(DAS)系统的事件分类综合数据集研究

【字体: 时间:2025年05月15日 来源:Scientific Data 5.8

编辑推荐:

  为解决 DAS 系统中事件准确分类难题,研究人员开展基于 Φ-OTDR 技术的 DAS 系统事件分类研究,构建含行走、车辆移动等事件的标注数据集,用 CNN 验证其质量,为机器学习模型开发提供资源,推动 DAS 技术应用。

  
在基础设施监测与安全防护领域,分布式声波传感(Distributed Acoustic Sensing, DAS)技术凭借光纤对长距离声信号的高分辨率捕捉能力,在地震监测、结构健康监测等场景展现出巨大潜力。然而,该技术面临高维噪声数据处理与事件精准分类的瓶颈:传统信号处理方法难以从复杂振动信号中提取有效特征,且公开高质量数据集匮乏,制约了机器学习模型的开发与验证。在此背景下,布尔诺科技大学(Brno University of Technology)的研究团队围绕 DAS 系统的事件分类展开研究,相关成果发表于《Scientific Data》,为该领域提供了关键数据支撑与技术参考。

研究团队采用基于相位敏感光时域反射(Φ-OTDR14)技术的 Optasense ODH-F DAS interrogator 系统,对埋设于校园地下 1 米的单模光纤链路进行监测。数据采集于 2023 年 4 月晴朗天气下完成,避免了环境噪声干扰,共记录行走、跑步、车辆行驶等日常活动,以及围栏攀爬、光纤篡改、井盖启闭等潜在安全威胁事件。

关键技术方法


  1. 数据采集与系统配置:利用 Φ-OTDR 技术,以 20 kHz 脉冲重复率、20 ns 激光脉冲宽度及 1 米空间采样间隔采集信号,覆盖 1663 个通道,实现对光纤沿线振动事件的高时空分辨率捕捉。
  2. 数据标注与特征处理:通过带限信号功率(Pband)计算与人工标注,生成含事件位置信息的位图文件(.npy 格式),结合快速傅里叶变换(FFT)过滤噪声信号,确保标注数据的准确性。
  3. 模型验证:采用卷积神经网络(CNN)模型,通过 80:10:10 的训练 - 验证 - 测试数据划分,验证数据集质量,模型最终实现 91.4% 的分类准确率。

研究结果


1. 数据集构成与标注


数据集包含汽车(20957 例)、施工(29169 例)、围栏活动(3601 例)等 9 类事件,以 HDF5 格式存储原始信号,搭配 JSON 元数据与 NumPy 位图文件。例如,汽车行驶的Pband呈现特定频段能量集中特征,而施工活动则表现为宽频能量分布,步行事件以间歇性能量脉冲为典型(图 3)。

2. 技术验证与模型性能


CNN 模型通过两层卷积层(64/256 个滤波器)与两层全连接层(1024/7 个神经元)架构,对经汉宁窗分帧(8192 样本 / 窗,2048 样本重叠)与过采样 DFT 处理的频域信号进行训练。测试结果显示,模型宏平均精度 85.7%、召回率 88.2%、F1 分数 86.8%,证明数据集具备良好的事件特征区分度。

3. 应用拓展与数据价值


除事件分类外,该数据集可用于深度学习特征提取研究。基于迁移学习理念,校园场景训练的模型有望快速适配城市中心等其他环境,降低跨场景应用的再训练成本。

研究结论与意义


本研究构建了首个公开的 DAS 系统事件分类综合数据集,填补了领域数据缺口。通过 Φ-OTDR 技术与 CNN 模型的结合,验证了数据驱动方法在复杂振动信号解析中的有效性,为地震预警、管道安全、公共区域安防等领域提供了可复用的研究工具。未来,该数据集可进一步推动无监督学习、实时监测算法的开发,助力 DAS 技术从实验室走向更广泛的实际应用场景,提升关键基础设施的智能化监测水平。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号