
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多阶门控网络与全局-局部注意力的实时X射线安检多尺度违禁品检测方法
【字体: 大 中 小 】 时间:2025年08月28日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文提出了一种轻量级Transformer架构——多阶门控网络(MoGNet),通过多阶门控聚合块(MogaBlock)、全局-局部自注意力(GLSA)机制和动态融合模块(DynamicFusion)三大创新,在保持64.1 FPS实时性能的同时,在五个数据集上取得75.4%-96.6%的mAP50检测精度,为X射线安检中的多尺度目标检测与特征纠缠问题提供了最优的精度-效率平衡方案。
Highlight
本研究提出的多阶门控网络(MoGNet)通过三大核心技术突破解决了X射线安检领域的核心矛盾:1)MogaBlock模块通过门控交互实现多阶特征提取,能精准捕捉X射线图像中微小/遮挡目标的复杂空间模式;2)全局-局部自注意力(GLSA)机制采用双路径结构同步处理全局上下文与局部几何特征,在严重遮挡场景下仍保持强判别力;3)动态多尺度融合(DynamicFusion)模块通过可学习权重实现跨尺度特征自适应整合,在保证64.1 FPS实时性能的前提下,于SIXray等五大数据集实现最高96.6%的mAP50。
Limitations
在CLCXray数据集上,MoGNet对中等尺寸物体的检测精度(mAPm=34.8%)略低于ForkNet(36.3%),这源于GLSA模块在全局与局部特征平衡上的极端倾向。跨数据集验证显示模型在DvXray上的迁移性能仅达62.3%,揭示出现有方法对设备间成像差异的敏感性。
Conclusion
MoGNet通过MogaBlock、GLSA和DynamicFusion的协同架构,在X射线安检领域首次实现了精度(mAP50提升4.2%-15.8%)与效率(64.1 FPS)的协同突破。该框架为机场等高通量场景提供了首个可部署的Transformer基实时检测方案,其门控特征交互范式对医学影像分析等领域具有普适启示。
生物通微信公众号
知名企业招聘