基于2D Transformer与注意力融合模型的高效三维磁共振图像重建方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月29日 来源：Biomedical Signal Processing and Control 4.9

编辑推荐：

　　针对3D MRI重建中计算资源消耗大、空间细节丢失等问题，研究人员提出SVFR方法，通过2D Vision Transformer(ViT)处理正交切片并结合注意力融合模型，在降低40%内存消耗的同时保持优异重建性能。该研究为临床高分辨率3D MRI快速重建提供了新思路。

磁共振成像(Magnetic Resonance Imaging, MRI)作为现代医学诊断的核心技术，其三维成像能力对脑部微小病灶和血管病变的检测至关重要。然而，3D MRI面临数据采集时间长、重建计算复杂度高的双重挑战——传统3D U-Net等卷积神经网络(CNN)方法因内存占用大、局部感受野限制等问题，难以兼顾计算效率与重建精度。更棘手的是，直接堆叠2D切片重建会丢失关键的空间关联信息，可能影响肿瘤边界判定等临床决策。

针对这一难题，中国研究人员团队创新性地提出切片-体积融合重建(Slice-to-Volume and Fusion Reconstruction, SVFR)框架。该方法突破性地将自然语言处理领域的Transformer引入医学图像重建，通过三阶段处理流程：首先从横断面、矢状面和冠状面三个正交方向采集2D欠采样k-空间数据；随后采用预训练的2D Vision Transformer(ViT)进行切片级重建；最后通过注意力融合模型在空间维度整合三维特征。实验证明，该方法在3D多线圈脑部k-空间数据集和斯坦福膝关节数据集上，不仅将内存消耗降低40%，还在4倍加速采样条件下保持峰值信噪比(PSNR)达38.7dB，相关成果发表于《Biomedical Signal Processing and Control》。

关键技术包含：1) 多方向2D切片采样策略；2) 基于ImageNet预训练的ViT迁移学习；3) 三维注意力特征融合模块。研究团队特别设计了通道-空间双注意力机制，通过并行提取三方向体积特征，有效补偿切片重建导致的空间信息损失。

【Transformer重建模块】
通过比较ViT与U-Net在单切片重建中的表现，发现预训练ViT在4倍加速采样时，结构相似性指数(SSIM)提升0.12，证明其全局注意力机制优于CNN的局部特征提取能力。

【融合模型效能】
体积融合阶段采用3D卷积与注意力门控结合的方式，实验显示该模块能使脑室边缘等细微结构的重建误差降低21%，验证了多方向特征互补的必要性。

【资源效率分析】
当通道数设置为64时，传统3D U-Net需18GB显存，而SVFR仅消耗10.8GB，同时推理速度提升2.3倍，解决了高分辨率重建的硬件瓶颈问题。

该研究开创性地将Transformer引入医学图像重建领域，其价值体现在三方面：临床层面，为肿瘤体积测量等精准医疗需求提供可靠工具；技术层面，证明预训练模型迁移在医学图像处理的可行性；方法论层面，开创的"二维处理-三维融合"范式为其他医学影像分析提供借鉴。作者特别指出，未来需增强ViT的可解释性，通过可视化技术建立临床信任机制。研究获得国家重点研发计划(2023YFC2411100)等基金支持，相关代码已在GitHub开源。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号