密集协同注意力网络:一种用于通信设施图像分类的有效卷积神经网络模型

《Engineering Applications of Artificial Intelligence》:Dense synergistic attention network: An effective CNN model for communication facilities image classification

【字体: 时间:2025年12月06日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  通信设施图像分类研究通过改进DenseNet架构和设计多尺度注意力机制模块,显著提升模型在复杂环境下的分类准确率(94.83%)和帧率(51.52 fps),有效解决电信运营商安装维护图像质检效率与精度问题。

  
作者:余电志、闵燕、杨健、李洪浩、周娇、杨飘、田倩、李圆圆、钱倩
中国电信贵州公司云计算与网络运营部,贵州省贵阳市,550000,中国

摘要

通信设施的图像识别工作对于评估电信运营商的服务成果以及监控安装和维护服务的一致性至关重要。本研究采用深度学习算法对安装和维护人员提交的现场照片中的通信设施进行分类。以DenseNet作为基础模型,我们增强了模型内的信息流动,并运用了几种改进的注意力机制,以便在复杂的安装和维护环境中更有效地识别通信设施图像。在相同的模型规模配置下,实验结果表明,密集协同注意力网络(DSANet)在通信设施图像分类任务中的表现优于DenseNet,验证准确率达到94.83%,帧率为每秒51.52帧,验证准确率提高了2.12%,运行效率提高了9.5%。

引言

在安装和维护服务过程中,电信运营商会上传大量通信设施图像(CFI)。这些上传的CFI是电信服务过程中的重要数字资产,可用于记录通信设施的实际安装和维护情况,并评估服务质量。然而,由于服务环境的复杂性、安装人员工作能力的差异以及他们情绪和心理状态的变化,CFI的上传过程中存在各种问题。最严重的影响是图像中的设施类型与工作订单中报告的类型不一致。全球电信运营商都在努力提高服务过程的效率和精确度(Chen, 2019; Tsai et al., 2006; Yang et al., 2013),而上述操作错误会间接削弱资源系统的功能,降低公司资源信息的可靠性,从而严重限制公司资产的数字化进程。为了解决这个问题,检查电信人员上传的CFI至关重要。然而,在公司内部,CFI的检查过程存在许多挑战。首先,如果手动进行检查,将耗费大量人力,并且每个检查人员都需要具备高水平的专业知识和识别技能。电信运营商的资源系统每天每省大约生成6000到15000张CFI,因此手动识别如此大量的上传数据是不现实的。其次,即使通过后续手动检查重新拍摄不符合要求的图像,也很难重新上传安装结果,因为安装人员已经离开了现场。因此,需要实施一种自动化图像检测解决方案,以平衡即时性、效率和准确性,有效管理CFI的标准化上传流程。
为了解决上述问题,本研究采用改进的深度学习人工神经网络对CFI进行分类,从而实现满足公司内部要求的通信设施类型自动化图像检测解决方案。我们的研究主要贡献如下:
  • 我们构建了CFI数据集,这是目前唯一可用于分类通信设施图像的数据集。与固定规模的一般数据集不同,CFI数据集包含了电信运营商实际服务过程中频繁上传的5000多张不同规模的通信设施图像。该数据集满足了企业对AI模型训练和实际应用的需求。
  • 我们比较了十四种经典模型在通信设施数据集上的性能,并优化了表现最好的DenseNet模型。通过在不同模块之间建立通道,我们增强了DenseNet的信息流动结构,提高了其分类复杂通信设施图像的能力。
  • 设计了四种改进的注意力机制模块,以增强模型对多尺度特征和纹理的关注。这些模块被修改为模型的主要卷积单元,而不仅仅是少数局部嵌入的注意力模块。这种特殊设计赋予了这些模块增强注意力和处理特征的能力,进一步强化了DenseNet中密集层的结构。不同的模块部署方法也促使我们探索了所提出的DSANet模型的最佳结构。实验结果表明,DSANet的SCTK-mini配置在性能和效率上比DenseNet有更明显的提升。

相关工作

图像分类是图像分析中的一个基本且重要的任务。其应用场景包括医学诊断、工程故障检测、物体状态确定等(Rodrigues Moreira et al., 2025; Yang et al., 2013; Zhao et al., 2024)。在自动化图像分类研究的早期阶段,人们关注的是传统算法,如SVM(Kumar et al., 2025)、随机森林(Blum et al., 2025)等。Li等人(2018)致力于对花生图像进行分类。

整体工作流程

在研究开始时,我们设计了一个明确的工作流程(图1),分为三个步骤。第一步是数据集的收集,包括从系统中收集图像、清洗和标注图像、计算注释者一致性指标以及分割数据。第二步是选择模型原型,这为我们的研究奠定了基础。许多传统网络都在这个阶段进行了评估。

实验与结果

为了确定DSANet的最佳模型结构,我们训练并测试了引入四种注意力机制(KSL、TFL、CSL和CWL)的网络在CFI数据集上的分类性能。设计了九种不同的DSANet配置进行性能比较,包括CT、CK、SCKT、SCTK、DCTK、TCTK、SCTK-mini、DCTK-mini和TCTK-mini,这些配置基于比例的不同而有所区别。

结论

本文以CFI数据集为主要研究对象,旨在寻找一个优秀的模型来分类通信设施图像。在比较了各种经典卷积神经网络的分类性能后,选择了DenseNet作为进一步修改的原型网络。我们修改了SENet、SKNet和协调注意力机制,设计了新的注意力模块,如KSL、TFL、CSL和CWL,并利用它们来改进基本模型。

作者贡献声明

余电志:撰写 – 审稿与编辑、撰写 – 原稿、软件、方法论、调查、概念化。 闵燕:监督、项目管理。 杨健:监督、软件。 李洪浩:监督、调查。 周娇:方法论、数据管理。 杨飘:撰写 – 审稿与编辑、监督、项目管理。 田倩:撰写 – 审稿与编辑、项目管理、方法论。 李圆圆:撰写 – 审稿与编辑、项目管理。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所报告的工作。

致谢

作者感谢中国贵州省的中国电信贵州公司提供了他们的CFI数据集用于我们的研究工作。本研究部分得到了中国电信贵州公司的支持。
Jing Qian将在论文的审稿和发表过程中的所有阶段以及发表后负责与我们的沟通。这一职责包括回答关于我们的结果、数据、方法论和材料的任何后续问题。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号