
-
生物通官微
陪你抓住生命科技
跳动的脉搏
轻量化多尺度全局注意力增强网络在图像超分辨率重建中的创新应用
【字体: 大 中 小 】 时间:2025年07月25日 来源:Image and Vision Computing 4.2
编辑推荐:
针对Transformer模型在图像超分辨率(SR)任务中存在的计算冗余和窗口限制问题,研究人员提出轻量化多尺度全局注意力增强网络(LMGAE-Net)。通过创新设计多尺度全局注意力块(MGAB)和多组位移融合块(MSFB),显著提升了远程信息捕获能力和局部特征融合效果。实验表明该模型在保持轻量化的同时,性能大幅超越现有方法,为医疗影像等领域的实时高清成像提供了新方案。
在医疗影像诊断和卫星遥感等领域,高清图像往往意味着更准确的判断。然而受硬件设备限制,获取高分辨率(HR)图像常面临巨大成本。传统基于卷积神经网络(CNN)的超分辨率方法虽取得进展,但受限于局部感受野;而Transformer模型虽能捕获全局信息,却存在计算复杂度高和窗口不连续等问题。特别是当处理大尺寸医学图像时,现有方法要么细节恢复不足,要么需要昂贵计算资源,这成为制约临床应用的瓶颈。
针对这一挑战,中国西华师范大学的研究团队在《Image and Vision Computing》发表创新成果。他们开发的轻量化多尺度全局注意力增强网络(LMGAE-Net),通过两大核心技术突破:多尺度全局注意力块(MGAB)采用分组策略,使不同窗口尺寸的自注意力计算能并行捕获多尺度特征;多组位移融合块(MSFB)则通过巧妙的特征位移操作,在保持1×1卷积计算量的同时实现3×3卷积的感受野。这种"全局-局部"协同设计,成功解决了传统方法在计算效率与特征捕获能力间的矛盾。
关键技术方法包括:1)分层网络架构设计,包含浅层特征学习、基于LMGSE的深层特征提取等四个模块;2)MGAB模块的分组多窗口自注意力计算;3)MSFB模块的空间位移特征融合技术。实验选用五个标准超分辨率数据集进行验证。
【Network structure】研究构建了包含37.6万参数的轻量化网络,通过分层设计实现从全局上下文建模到局部细节增强的完整特征学习框架。给定低分辨率输入ILR∈R3×H×W,网络首先提取浅层特征,再经MGAB和MSFB模块的级联处理,最终重建出高分辨率图像。
【Experimental results】定量评估显示,LMGAE-Net在Set5等数据集上PSNR指标提升0.15-0.38dB,同时计算量减少40%以上。定性分析表明,该方法在纹理细节恢复方面显著优于对比模型,特别是在医学影像的微小结构重建上表现突出。
【Conclusion】该研究通过MGAB和MSFB的创新设计,突破了Transformer模型在超分辨率任务中的固有局限。相比传统滑动窗口机制,多尺度分组策略使计算复杂度从O(n2)降至O(n),同时保持全局建模能力。值得关注的是,MSFB模块通过特征位移的简单操作,实现了参数效率与局部特征学习的平衡,这对开发边缘计算设备适用的轻量化模型具有重要启示。
这项工作的科学价值在于:一方面为视觉Transformer模型提供了新的注意力计算范式,另一方面建立了轻量化网络设计的新标准。研究获得国家自然科学基金(62176217)和四川省科技计划(2024ZYD0272)支持,相关技术已在医学影像分析系统中开展应用测试,展现出良好的临床转化前景。
生物通微信公众号
知名企业招聘