
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混合Transformer与卷积迭代优化的金字塔网络在大脑大变形图像配准中的应用研究
【字体: 大 中 小 】 时间:2025年05月06日 来源:Scientific Reports 3.8
编辑推荐:
为解决大脑磁共振(MR)图像大变形配准中多尺度特征融合不足和解码器设计单一的问题,研究人员提出了一种结合Transformer全局建模能力与卷积局部优化策略的混合金字塔网络(HTCO-Pyramid)。通过设计增强型双分支编码器和分层迭代解码器,在LPBA40等三个公开数据集上实现了最高配准精度(DSC 0.737),显著优于9种前沿方法,为临床实时诊断提供了新方案。
在医学影像分析领域,大脑图像的精确配准是实现疾病诊断、手术导航和治疗评估的关键技术。然而,当面对阿尔茨海默病患者脑萎缩等大变形场景时,传统配准方法如SyN需要重复迭代计算,耗时长达70秒/例;而现有深度学习方案如VoxelMorph(VM)又受限于卷积核感受野,难以捕捉全局变形特征。更棘手的是,主流金字塔网络过度关注解码路径的多层变形场融合,却忽视了特征编码器的关键作用,且缺乏针对不同尺度特征图的定制化设计。
甘肃中医药大学医学信息工程学院崔新新等团队在《Scientific Reports》发表的研究中,创新性地提出了HTCO-Pyramid网络。该研究首先设计了四种编码器变体(包括带先验信息的增强双分支结构),通过对比实验证实额外下采样原始图像能补偿特征信息损失;其次在解码路径低分辨率层(L=4,3)部署4个连续Swin-Transformer模块捕捉全局关联,高分辨率层(L=2,1)采用轻量反卷积模块(DeconvBlock)处理局部运动;最后引入卷积迭代策略,通过公式(1)-(4)实现每层变形场的渐进优化。关键技术包括:基于LPBA40/Mindboggle101/OASIS三个公开数据集的跨数据集验证、结合局部归一化互相关(NCC)与扩散正则化的混合损失函数(公式5)、以及CUDA加速的变形场质量评估(%|J?|≤0)。
Enhanced pyramid feature encoder
通过对比Pure_ConvBlock、Res_ConvBlock等四种编码器,发现ExtraPrior_ConvBlock在LPBA40数据集取得最高DSC(0.737±0.013),证明直接下采样原始图像提供的先验特征能有效缓解连续池化导致的空间信息丢失。
Multi-scale pyramid iterative decoder
低尺度层采用Swin-Transformer计算初始残差变形场φ4,再通过STN扭曲图像后二次迭代生成φ41(公式1)。可视化显示热图中亮区从全局均匀分布逐渐聚焦局部大变形(图7),证实了分层设计的有效性。
Comparative analysis
在Mindboggle101极端变形案例中,该方法DSC(0.634)显著优于PiViT(0.602),且折叠点占比(%|J?|≤0)仅0.067%,表明其强鲁棒性。交叉数据集测试中,OASIS训练模型在LPBA40测试集DSC达0.709,优于NICE-Trans 0.703(表12)。
该研究证实,融合Transformer全局感知与卷积局部优化的金字塔框架,能显著提升大变形配准性能。其创新性体现在:首次在解码层引入卷积迭代概念,通过φL与φLi的融合实现精细运动分解;设计的先验补偿机制使编码器特征提取效率提升3.2%。局限在于计算效率(0.419s/例)仍落后于PiViT(0.029s),未来可通过混合精度训练进一步优化。这项成果为脑部病变的动态监测提供了新工具,尤其对脑萎缩定量评估具有重要临床价值。
生物通微信公众号
知名企业招聘