基于视频理解技术的机场CCTV影像能见度预测研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月20日 来源：Kuwait Journal of Science 1.2

编辑推荐：

　　为解决机场能见度预测中单帧图像分析无法捕捉动态时序特征的问题，研究人员创新性地采用视频理解技术，构建了融合RGB图像、光流和SIFT特征的三流网络模型。该模型在测试集上R2均值达0.896，准确率0.860，显著优于传统方法，为机场安全监测提供了新范式。

在航空安全领域，跑道视程（RVR_1A）的精准预测直接关系到航班起降安全。传统依赖单帧图像分析的能见度预测方法存在明显局限——无法捕捉雾霾等气象条件的动态变化特征，而芬兰Vaisala公司开发的AMOS系统虽能实时监测气象数据，但其激光能见度仪在雾天存在检测精度低、成本高昂等问题。这促使研究人员开始探索基于计算机视觉的替代方案。

国内研究人员创新性地将视频理解技术引入能见度预测领域。通过分析机场固定监控摄像头拍摄的夜间视频数据（0-3AM），构建了包含370个样本的数据集，样本按能见度分为三类：低于500米（差）、500-800米（预警）、高于800米（良好）。研究团队提出了一种轻量级三流网络架构，该模型同时处理RGB图像、Farneb?ck光流和张量化的SIFT（尺度不变特征变换）描述符，通过多模态特征融合实现时空动态捕捉。

关键技术包括：1）采用Farneb?ck算法计算密集光流替代传统Brox方法；2）基于MiDaS模型和大气散射模型合成道路能见度数据集；3）设计含横向连接的5层卷积网络进行特征整合。实验显示，在机场数据集上，三流网络R²达0.898（±0.018），优于CNN-LSTM（0.813）和R(2+1)d（0.875）；在合成道路数据集中也保持0.863的R²。

主要发现：

模型对比：视频方法普遍优于图像模型，三流网络比ResNet-50提升18.6%的R²值
时序分析：光学流网络（Optical-flow-net）单独使用时准确率达90.4%，证实运动信息的关键作用
特征融合：SIFT特征在低能见度条件下稳定性突出，与光流组合使分类准确率提升5.2%
参数优化：输入帧数组合"1-2-3"（1帧RGB+2光流+3SIFT）实现最佳平衡

讨论与展望：该研究首次验证了视频时序特征在能见度预测中的优越性，其轻量化设计（仅2.67M参数）有利于实际部署。局限在于对静态场景的依赖性，且SIFT计算耗时（2.04秒/样本）。未来可探索Transformer架构与三维卷积的融合，并扩大真实场景数据集验证泛化能力。论文发表于《Kuwait Journal of Science》，为气象监测与计算机视觉的跨学科研究提供了新思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号