
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于非下采样剪切波变换与深度学习的多模态医学图像融合方法研究
【字体: 大 中 小 】 时间:2025年08月13日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对多模态医学图像融合(Multi-Modal Medical Image Fusion, MMMIF)中存在的空间分辨率低、对比度差等问题,提出了一种结合非下采样剪切波变换(Non-Subsampled Shearlet Transform, NSST)与卷积神经网络(Convolutional Neural Network, CNN)的新型融合框架。研究人员开发了并发去噪增强网络(Concurrent Denoising and Enhancement Network, CDEN)对子带进行处理,采用AlexNet进行低频系数(Low-Frequency Coefficients, LFC)融合,并创新性地将脉冲耦合神经网络(Pulse Coupled Neural Network, PCNN)与新型和改进拉普拉斯算子(Novel Sum-Modified Laplacian, NSML)相结合处理高频系数(High-Frequency Coefficients, HFC)。实验结果表明,该方法在边缘保留指标(QAB/F)上比现有方法提升约16.5%,为临床诊断提供了更可靠的决策支持。
在医学影像诊断领域,多模态医学图像融合(Multi-Modal Medical Image Fusion, MMMIF)技术正面临着前所未有的机遇与挑战。就像拼图游戏需要将不同形状的碎片组合成一幅完整图画一样,临床医生也需要将来自计算机断层扫描(CT)、磁共振成像(MRI)、正电子发射断层扫描(PET)等不同成像模态的信息整合起来。然而,这些图像往往各有所长又各有所短——功能图像可能空间分辨率不足,而解剖图像可能对比度欠佳。更棘手的是,简单的图像叠加会导致关键信息丢失或失真,就像把不同语言的报纸剪贴在一起,最终可能得到一篇谁也看不懂的文章。
面对这一困境,Taif大学的研究团队在《Scientific Reports》上发表了一项突破性研究。他们创造性地将数学领域的剪切波变换与人工智能技术相结合,开发了一套全新的图像融合算法。这项研究最引人入胜之处在于它模拟了人类视觉系统处理信息的方式:先分解图像为不同频率成分,再分别优化处理,最后重新组合。就像交响乐指挥家协调不同乐器声部一样,该算法能够完美平衡来自不同成像模态的互补信息。
研究人员采用了几项关键技术:首先使用非下采样剪切波变换(NSST)将图像分解为低频和高频子带;然后设计并发去噪增强网络(CDEN)进行子带优化;对于低频信息采用AlexNet网络进行语义级融合;对高频细节则创新性地结合脉冲耦合神经网络(PCNN)与新型和改进拉普拉斯算子(NSML)进行处理。实验使用了哈佛医学院全脑图谱中的180对多模态图像作为样本。
在"材料与方法"部分,研究详细阐述了NSST的数学原理。这个变换就像一把精密的"数学显微镜",能够捕捉图像中不同方向和尺度的特征。其核心在于两个关键矩阵:负责频率细化的各向异性缩放矩阵S,和控制方向选择性的剪切矩阵G。公式ψj,l,k=23j/2ψ(GlSjx-k)完美描述了这一变换过程,其中j代表尺度,l控制方向,k决定空间位置。

"提出的CNN-剪切波融合模型"部分展示了完整的算法流程。就像精密的瑞士手表由多个协同工作的齿轮组成一样,该模型通过六个关键步骤实现卓越性能:NSST分解、CDEN去噪增强、AlexNet低频融合、NSML高频特征提取、PCNN决策融合,最后通过逆NSST重建图像。其中最具创新性的是将深度学习与传统图像处理方法有机结合——AlexNet擅长捕捉全局语义特征,而受生物视觉启发的PCNN则精于提取局部细节。

"实验分析"部分的结果令人印象深刻。在六组不同模态图像配对测试中,该方法在空间频率(SF)、图像熵(IE)、互信息(MI)等关键指标上全面领先。特别是边缘保留指标QAB/F达到0.691,比次优方法提高16.5%。这相当于在百米赛跑中领先对手15米以上的巨大优势。图像质量指数(IQI)接近理论最大值1的表现,证明该方法能够完美保留原始图像的关键特征。

研究结论部分指出,这项工作的意义不仅在于提出了一个性能优越的融合算法,更重要的是建立了一个可扩展的框架。就像乐高积木可以通过不同模块组合构建各种造型一样,该研究的NSST+CDEN架构可以灵活适应CT/MRI、PET/MRI等不同模态组合。与现有方法相比,其优势主要体现在三个方面:通过NSST实现精确方向分解、利用CDEN进行自适应特征增强、采用混合策略平衡全局与局部信息。
这项研究为医学图像分析领域树立了新的技术标杆。就像GPS导航系统彻底改变了出行方式一样,该成果有望革新临床影像诊断的工作流程。特别值得关注的是,研究团队没有一味追求模型复杂度,而是通过巧妙的算法设计,在GTX 1080显卡上就实现了临床可用的性能,这为资源有限医疗机构的推广应用铺平了道路。未来,随着深度学习技术的进一步发展,这种融合数学变换与神经网络的研究范式,或将在更广泛的医学影像处理领域绽放异彩。
生物通微信公众号
知名企业招聘