通过基于混合多神经网络的算法对铣削力进行长期序列预测

《Engineering Applications of Artificial Intelligence》:Long time series prediction of milling force via a hybrid multi neuro-network-based algorithm

【字体: 时间:2025年10月22日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  针对无人机图像中低分辨率导致的小目标检测难题,本文提出D2A-Detector双域注意力框架,通过空间域的三重注意力卷积(SFTAConv)实现无信息损失的特征传播,结合频率域的混合注意力(FD-HAT)重构高频特征,并设计分类辅助定位(CAL)分支平衡任务损失。实验表明在VisDrone2019Det、DOTA和PASCAL VOC上分别提升AP指标2.2%、1.7%、5.3%,显著优于现有SOTA模型。

  在现代计算机视觉技术迅速发展的背景下,无人机图像中的小目标检测已成为一个备受关注的研究领域。由于无人机在高空拍摄时受到环境因素的限制,所获取的图像往往存在严重的细节退化和分辨率下降问题,这给小目标的识别带来了巨大挑战。传统的目标检测模型虽然在处理常规大小目标时表现出色,但在面对小目标时却面临双重困境:一方面,目标本身的像素覆盖面积有限,使得特征提取变得困难;另一方面,图像在采集过程中受到光照、天气、遮挡等因素的影响,导致目标特征模糊不清,难以与背景有效区分。因此,如何在保持图像空间细节的同时,提升小目标在频率域中的可区分性,成为研究的重点。

本研究提出了一种双域注意力机制(Dual-Domain Attention, D2A),旨在通过同时关注图像的空间域和频率域,提高小目标检测的精度和鲁棒性。具体而言,我们设计了一个名为SFTAConv(Step-Free Triple-Attention Convolution)的模块,用于在空间域中实现特征的高效传播。该模块通过结合空间-通道交互机制和一种无损的空间到深度变换技术,能够在不丢失关键信息的前提下,增强小目标的细微特征,同时抑制背景干扰。在频率域方面,我们引入了FD-HAT(Frequency-Domain Hybrid Attention)机制,该机制通过并行处理高频和低频特征,对图像中的结构和纹理信息进行联合校准,从而恢复被遮挡或模糊的小目标的判别性表示。此外,我们还设计了一个分类辅助定位(Classification-Assisted Localization, CAL)分支,该分支通过将分类任务中的语义置信度图传播到定位任务中,进一步优化小目标的边界框回归,提升检测的准确性。

为了验证所提出方法的有效性,我们对多个具有代表性的数据集进行了实验评估,包括VisDrone2019Det、DOTA和PASCAL VOC。这些数据集涵盖了不同场景下的小目标检测任务,其中VisDrone2019Det专注于无人机图像中的目标识别,DOTA则用于遥感图像中的小目标检测,而PASCAL VOC则是一个广泛用于目标检测的通用数据集。实验结果表明,我们的模型在这些数据集上分别取得了2.2%、1.7%和5.3%的平均精度(AP)提升,且在检测性能上与当前最先进的检测器(SOTA detectors)相媲美。这一结果充分证明了D2A-Detector在小目标检测任务中的优越性。

在空间域中,SFTAConv模块的设计是本研究的核心创新之一。传统的卷积神经网络在处理小目标时,往往依赖于大量的下采样操作,这会导致图像中关键的细节信息被丢失。为了解决这一问题,SFTAConv模块采用了一种无步长的三注意力卷积结构,通过空间-通道交互机制,使得特征在传播过程中能够更好地保留细节信息。同时,该模块还结合了无损的空间到深度变换技术,能够在不降低图像分辨率的前提下,将特征图的空间信息与通道信息进行融合,从而增强小目标的可识别性。这种设计不仅减少了信息丢失,还有效抑制了背景噪声对小目标检测的干扰,使得模型在复杂场景下仍能保持较高的检测精度。

在频率域方面,FD-HAT机制的引入则是为了应对传统方法在处理小目标时的另一个关键问题:深度特征的模糊化。在高频特征中,边缘和纹理信息对于小目标的识别至关重要,而低频特征则更多地反映了目标的整体结构。因此,FD-HAT模块通过并行处理高频和低频特征,对它们进行自适应的权重调整,以恢复被下采样操作破坏的特征信息。随后,该模块利用一种称为Conv-PixelShuffle-Conv(CPC)的结构,对处理后的特征进行重构,使其能够更好地适应不同分辨率下的小目标检测需求。通过这种方式,FD-HAT不仅能够恢复小目标的高频细节,还能增强其低频结构特征,从而提高整体的检测性能。

除了在空间域和频率域的优化,CAL分支的设计进一步提升了小目标检测的准确性。在传统的检测框架中,分类任务和定位任务往往是相互独立的,这可能导致两者的损失函数在训练过程中出现不平衡。特别是在处理小目标时,分类任务中的语义信息对定位任务具有重要的指导作用,而定位任务中的空间信息又能够为分类任务提供更准确的上下文。因此,CAL分支通过将分类任务中的语义置信度图传播到定位任务中,使得两个任务能够相互辅助,从而减少因任务分离导致的误差。这种设计不仅提高了模型对小目标的定位精度,还增强了分类任务的鲁棒性,使得整个检测流程更加协同和高效。

在实验评估部分,我们对多个数据集进行了详尽的测试。VisDrone2019Det数据集是一个专门用于无人机图像目标检测的数据集,包含多种场景下的目标实例,涵盖了从城市建筑到自然景观的各种类型。通过在该数据集上的实验,我们发现D2A-Detector在保持高精度的同时,显著提升了小目标的检测能力。DOTA数据集则是一个用于遥感图像目标检测的大型数据集,其中包含大量复杂分布的小目标。在DOTA数据集上的测试表明,我们的模型不仅能够准确识别这些小目标,还能在密集目标场景下保持较高的召回率和精确度。PASCAL VOC数据集作为一个广泛使用的通用目标检测数据集,其包含的类别和目标大小范围较广,能够有效评估模型在不同场景下的泛化能力。实验结果表明,D2A-Detector在PASCAL VOC数据集上的表现同样优于现有方法,显示出其在不同应用场景下的适应性和有效性。

此外,我们还进行了大量的消融实验,以验证各个模块对模型性能的具体贡献。通过移除SFTAConv、FD-HAT和CAL分支中的某些组件,我们发现每个模块在提升检测精度方面都起到了关键作用。特别是SFTAConv模块,在减少信息损失和增强细节学习方面表现突出;FD-HAT模块则在恢复深度特征和提升判别性表示方面具有显著优势;而CAL分支则通过任务间的协同优化,进一步提升了模型的整体性能。这些实验结果不仅证明了D2A-Detector的优越性,还为后续研究提供了重要的参考依据。

在实际应用中,小目标检测技术对无人机图像处理具有重要的意义。例如,在无人机巡检任务中,小目标如电线、管道或树木等,往往需要被精确识别以确保安全性和效率。在自动驾驶领域,小目标检测能够帮助车辆识别道路上的行人、交通标志和障碍物,从而提升驾驶的安全性。在医疗诊断中,小目标检测可以用于识别医学影像中的微小病变,为疾病的早期发现提供支持。而在环境监测和遥感分析中,小目标检测技术能够帮助研究人员识别和分析地面上的微小物体,如建筑物、车辆或植被等,从而提高数据的准确性和可靠性。

本研究的创新点在于提出了一个综合考虑空间域和频率域特征的双域注意力框架。相比于传统的单域注意力机制,D2A-Detector能够更全面地捕捉图像中的细节信息和全局结构特征,从而提升小目标检测的精度。此外,通过引入SFTAConv、FD-HAT和CAL三个关键模块,我们的模型在特征传播、频率校准和任务协同方面都进行了优化,使其能够更好地适应不同场景下的小目标检测需求。这些模块的协同作用不仅减少了信息损失,还增强了模型对复杂环境的适应能力,使其在实际应用中具有更高的鲁棒性和准确性。

为了确保模型的高效性和实用性,我们在设计过程中也考虑了计算资源的限制。传统的深度学习模型往往需要大量的计算资源和内存支持,这在资源受限的无人机应用中可能是一个瓶颈。因此,我们对模型的结构进行了优化,使其能够在保持高检测精度的同时,降低计算复杂度和内存占用。这种优化不仅提高了模型的运行效率,还使其更适合部署在嵌入式设备或移动平台上,从而扩大了其应用范围。

综上所述,本研究提出了一种基于双域注意力机制的小目标检测框架,该框架通过空间域和频率域的协同优化,有效提升了小目标的检测精度和鲁棒性。实验结果表明,该方法在多个具有代表性的数据集上均取得了显著的性能提升,且能够与当前最先进的检测器相媲美。未来的研究方向可能包括进一步优化模型的计算效率,以适应更多实际应用场景,以及探索更复杂的注意力机制,以应对更加复杂的图像内容和环境条件。此外,我们还希望将这一方法应用于其他相关领域,如视频目标检测、三维目标识别等,以拓展其应用边界。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号