
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于2D Transformer与注意力融合模型的高效三维磁共振图像重建方法研究
【字体: 大 中 小 】 时间:2025年05月29日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
针对3D MRI重建中计算资源消耗大、空间细节丢失等问题,研究人员提出SVFR方法,通过2D Vision Transformer(ViT)处理正交切片并结合注意力融合模型,在降低40%内存消耗的同时保持优异重建性能。该研究为临床高分辨率3D MRI快速重建提供了新思路。
磁共振成像(Magnetic Resonance Imaging, MRI)作为现代医学诊断的核心技术,其三维成像能力对脑部微小病灶和血管病变的检测至关重要。然而,3D MRI面临数据采集时间长、重建计算复杂度高的双重挑战——传统3D U-Net等卷积神经网络(CNN)方法因内存占用大、局部感受野限制等问题,难以兼顾计算效率与重建精度。更棘手的是,直接堆叠2D切片重建会丢失关键的空间关联信息,可能影响肿瘤边界判定等临床决策。
针对这一难题,中国研究人员团队创新性地提出切片-体积融合重建(Slice-to-Volume and Fusion Reconstruction, SVFR)框架。该方法突破性地将自然语言处理领域的Transformer引入医学图像重建,通过三阶段处理流程:首先从横断面、矢状面和冠状面三个正交方向采集2D欠采样k-空间数据;随后采用预训练的2D Vision Transformer(ViT)进行切片级重建;最后通过注意力融合模型在空间维度整合三维特征。实验证明,该方法在3D多线圈脑部k-空间数据集和斯坦福膝关节数据集上,不仅将内存消耗降低40%,还在4倍加速采样条件下保持峰值信噪比(PSNR)达38.7dB,相关成果发表于《Biomedical Signal Processing and Control》。
关键技术包含:1) 多方向2D切片采样策略;2) 基于ImageNet预训练的ViT迁移学习;3) 三维注意力特征融合模块。研究团队特别设计了通道-空间双注意力机制,通过并行提取三方向体积特征,有效补偿切片重建导致的空间信息损失。
【Transformer重建模块】
通过比较ViT与U-Net在单切片重建中的表现,发现预训练ViT在4倍加速采样时,结构相似性指数(SSIM)提升0.12,证明其全局注意力机制优于CNN的局部特征提取能力。
【融合模型效能】
体积融合阶段采用3D卷积与注意力门控结合的方式,实验显示该模块能使脑室边缘等细微结构的重建误差降低21%,验证了多方向特征互补的必要性。
【资源效率分析】
当通道数设置为64时,传统3D U-Net需18GB显存,而SVFR仅消耗10.8GB,同时推理速度提升2.3倍,解决了高分辨率重建的硬件瓶颈问题。
该研究开创性地将Transformer引入医学图像重建领域,其价值体现在三方面:临床层面,为肿瘤体积测量等精准医疗需求提供可靠工具;技术层面,证明预训练模型迁移在医学图像处理的可行性;方法论层面,开创的"二维处理-三维融合"范式为其他医学影像分析提供借鉴。作者特别指出,未来需增强ViT的可解释性,通过可视化技术建立临床信任机制。研究获得国家重点研发计划(2023YFC2411100)等基金支持,相关代码已在GitHub开源。
生物通微信公众号
知名企业招聘