在巴基斯坦的医疗众筹项目中,捐赠者的行为对项目成功起着关键作用。本文采用了一种基于理论的方法,结合商业智能和监督式机器学习技术来分析捐赠者的行为模式及其对众筹项目成功率的影响
《Engineering Applications of Artificial Intelligence》:Donor behavior in healthcare crowdfunding success: A theory-driven approach using business intelligence and supervised machine learning in Pakistan
【字体:
大
中
小
】
时间:2025年11月09日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
针对移动医疗场景中轻量级模型跨域适应与特征提取不足的问题,提出DMF-MobileMamba双流多尺度融合架构。通过CNN与Mamba解耦设计,结合动态多尺度注意力融合及跨层引导增强模块,实现高效特征互补。实验表明,该模型参数仅4.039M,推理速度134.64ms,在6个医学数据集上分类精度显著优于现有轻量模型,适用于资源受限环境。
在移动医疗场景中,轻量级图像分类模型在边缘设备上的高效部署能够显著提升医疗服务的可访问性和实时性,为偏远地区医疗资源匮乏、移动终端实时诊断以及远程图像分析等场景提供可靠的技术支持。然而,当前主流的轻量级模型在医疗图像分类任务中仍面临诸多挑战,包括跨域适应性不足、特征提取能力有限等问题。针对这些限制,本文提出了一种基于引导增强的轻量级双流多尺度特征融合医疗适应分类网络——DMF-MobileMamba。该网络通过采用并行双流架构,结合卷积神经网络(CNN)的局部纹理提取能力与改进后的轻量级多尺度适配Mamba模块的全局远程依赖建模优势,实现了异构特征的互补性。同时,引入了多尺度注意力调制融合模块(MSA-Fusion),用于动态且加权地融合局部与全局特征。此外,还创新性地提出了跨层级引导增强注意力模块(CLGE),利用浅层高分辨率细节动态校正深层语义偏差,从而缓解模型层级间的表示不匹配问题。实验结果显示,DMF-MobileMamba仅需4.039百万(M)参数和2.438吉格浮点运算每秒(GFLOPS)的计算量,在六个医疗数据集上均表现出显著优于主流先进轻量级模型的分类准确率,并在移动设备上实现了134.64毫秒(ms)的实时推理速度。该网络为资源受限场景提供了高精度、低成本的解决方案。
医疗图像分类作为医疗领域的一项关键技术,广泛采用计算机视觉与深度学习方法,以实现对各类医学影像模态的自动化分析与分类。这种技术能够为临床医生提供可靠的诊断辅助,从而显著提升临床诊断的精度与治疗干预的效果。目前,医疗图像分类主要依赖于三种深度学习架构:卷积神经网络(CNN)、视觉Transformer(ViT)以及结合两者特性的混合模型。CNN因其局部感受野和层次化特征提取能力,能够有效识别局部病理特征,但其在捕捉长距离依赖关系方面存在局限,可能影响对全局病理模式的识别。相比之下,ViT通过自注意力机制,能够高效建模全局上下文信息,特别适用于具有复杂结构关系的医学影像。然而,ViT的计算复杂度随着输入分辨率的增加而呈二次增长,导致在处理高分辨率医学影像时产生较高的内存需求和计算成本。混合模型则试图融合CNN和ViT的优势,在多个医学图像分类任务中展现出优于单一模型的性能。尽管如此,这些混合模型仍未完全克服其基础架构所固有的限制,如CNN的深层堆叠需求、Transformer注意力机制的计算强度以及混合模型中参数数量增加与计算效率降低之间的矛盾。这些限制使得当前高精度模型的部署主要局限于具备强大计算资源的环境。
随着物联网(IoT)技术的快速发展,新型医疗应用不断涌现,如移动健康、远程诊断和应急治疗,这些应用对运行于边缘计算框架中的智能诊断系统提出了更高的要求。因此,深度学习模型需要具备良好的可访问性和快速部署能力,以适应边缘设备在计算资源和存储能力方面的限制。近年来,轻量级分类网络在通用计算机视觉任务中的应用已被成功转移到医疗图像分析领域,成为一种有前景的方法。这些轻量级网络通常保留了传统非轻量级网络的核心设计原则。例如,MobileNets系列(Howard等,2017)、ShuffleNets系列(Zhang等,2018)以及微软的StarNet(Ma等,2024)均基于CNN架构;SHViT(Yun和Ro,2024)则采用Transformer架构;而混合CNN-Transformer模型如MPVit(Lee等,2022)和MobileViT(Mehta和Rastegari,2021, 2022, Wadekar和Chaurasia,2022)则结合了CNN和Transformer的优势。这些模型主要通过深度可分离卷积和注意力稀疏化等方法实现参数减少,从而在一定程度上缓解了计算负担。然而,它们并未从根本上解决其基础架构的固有局限,如CNN受限于局部感受野,Transformer面临计算复杂度与输入规模之间的二次关系,而混合模型则通常表现出叠加的计算成本。更为重要的是,我们的研究发现,当这些轻量级分类网络应用于实际医疗图像分类任务时,仍然存在一些显著的挑战。
首先,主流轻量级模型对ImageNet-1K通用视觉图像数据集存在显著依赖,导致其在医疗图像分类任务中表现出较差的跨域适应性。这种局限源于对医学图像复杂性和领域特性的建模不足,从而在多种疾病分类场景中降低了模型性能。其次,轻量级模型在体积和深度上的严格限制,结合网络结构较浅和每层特征提取能力不足,导致轻量级模型的分类准确率与传统模型之间存在较大差距。此外,如果深层特征与浅层细节之间的语义关联被破坏,特征迁移过程中可能会产生误差累积,从而加剧分类的模糊性,最终对整体分类准确率产生负面影响。第三,尽管Transformer架构及其混合变体通过自注意力机制提升了长距离依赖建模能力,理论上能够提高分析性能,但其计算复杂度和内存需求显著增加,给边缘设备上的部署和实时推理带来了较大挑战。第四,当前主流的CNN-Transformer混合架构通常采用串行或嵌入式结构设计,但其固定的层级特征交互机制限制了局部与全局信息的有效融合,这种结构上的不足严重制约了模型在边缘计算环境中的表现。
为了充分发挥医疗边缘智能的潜力,有必要突破现有的框架,设计一种新的轻量级网络架构,从根本上解决计算效率与诊断精度之间的权衡问题。近年来,状态空间模型(SSMs)因其全局感受野特性和线性计算复杂度优势而受到广泛关注。其中,Mamba模型(Gu和Dao,2023)是SSMs的典范,展示了其在视觉任务中的强大潜力。后续研究(Chen等,2023, Du等,2024, Yang等,2024, Zhu等,2024)通过采用不同的扫描策略,将二维特征图转换为一维序列,从而显著提升了视觉处理任务中的适应性。在医疗图像分割领域,SegMamba(Xing等,2024)通过将U-Net框架与Mamba相结合,开创了SSM-CNN混合架构的先河。该架构有效融合了局部特征与长距离依赖关系,同时利用SSMs的线性复杂度特性,实现了推理效率的提升而不会牺牲精度。此外,Mamba2(Dao和Gu,2024)通过引入状态空间二元性(SSD)理论,进一步优化了视觉应用中的性能与计算效率。该理论简化了状态转移矩阵为标量形式,同时扩展了状态维度,从而提升了模型的表现力和计算效率。基于这些进展,我们提出,在医疗边缘智能场景中,结合卷积神经网络和Mamba模型的协同架构具有巨大的潜力,能够有效提升医疗图像分类的性能。
因此,我们提出了基于引导增强的轻量级双流多尺度特征融合医疗图像多疾病适应分类网络——DMF-MobileMamba。该网络的主要贡献包括以下几个方面:
首先,我们引入了轻量级多尺度适配Mamba(LMSA-Mamba),该模块结合了轻量级多尺度适配器与基于隐藏状态混合状态空间二元性(HSM-SSD)的高效视觉模型。这种方法能够以最少的可训练参数学习多尺度信息,从而实现对多种医疗图像数据集的适应能力。
其次,我们采用了双流并行架构,分别利用CNN的局部纹理敏感性和Mamba的全局长距离依赖建模能力进行独立特征提取。这种设计不仅最大化了异构特征之间的互补性,还保持了梯度反向传播路径的独立性。此外,我们还提出了一种多尺度注意力调制融合模块,通过多尺度注意力机制动态调整融合权重,从而实现全局上下文特征与局部高分辨率特征之间的有效交互。
第三,我们提出了跨层级注意力引导的特征增强机制以及跨层级特征交互策略。该框架能够从浅层高分辨率细节动态校正深层语义表示,为解决深度神经网络中不同特征层级之间的固有表示不匹配问题提供了新的思路。
第四,我们的DMF-MobileMamba模型仅需4.039百万(M)参数和2.438吉格浮点运算每秒(GFLOPS)的计算量。除了具有较低的计算成本和较高的处理速度外,DMF-MobileMamba在六个涵盖多种疾病的医疗图像数据集上,均表现出优于当前最先进的模型的分类准确率。图1展示了我们的模型与先进模型在ISIC2018数据集上的性能对比结果。
在传统医疗图像分类模型方面,CNN是深度学习领域的重要基础架构,并在早期医疗图像分类研究中被广泛采用。例如,Anima Kujur等(2022)对四种CNN变体——S-CNN、ResNet50、InceptionV3和Xception——在超过两个脑部MRI图像数据集上的分类性能进行了比较分析。该研究旨在评估这些模型在不同数据集上的表现能力。通过这些研究,我们可以看到CNN在医疗图像分类中的广泛应用及其优势。然而,CNN在处理复杂医学图像时,仍存在跨域适应性不足、特征提取能力有限等问题,需要进一步优化。
在初步研究中,我们发现,医疗图像分类的性能提升依赖于局部特征与长距离依赖关系的有效结合。为了充分挖掘这两种特征表示的优势,出现了多种混合模型架构,这些架构可以分为三种主要类型:串行、嵌入式和并行。如图2所示,代表性的模型包括MobileViT、MPViT和ARESNet等,它们分别采用了不同的混合架构设计。通过这些模型的比较,我们可以看出不同架构在性能和效率上的差异。例如,串行架构通常将CNN和Transformer按顺序连接,使得特征在不同层级之间传递,但其固定的层级交互机制可能限制了特征融合的效果。嵌入式架构则将Transformer模块嵌入到CNN结构中,以提升模型的全局建模能力,但其计算复杂度较高,难以在边缘设备上实现高效的实时推理。并行架构则将CNN和Transformer并行处理,分别提取局部与全局特征,再通过融合模块进行整合,这种方法在保持计算效率的同时,能够有效提升模型的分类准确率。
为了验证DMF-MobileMamba在医疗图像分类中的有效性,我们使用了六个数据集:ISIC2018数据集(Tschandl等,2018)、新冠肺部X光数据集(KADIR等,2020)、Kvasir数据集(Pogorelov等,2017)、脑肿瘤(MRI扫描)数据集(Bhuvaji等,2020)、胸部CT扫描图像数据集以及一个来自新疆某医院皮肤病变数据集(XJUSD)。这些数据集涵盖了多种疾病类型,能够全面评估模型在不同医疗场景中的性能。通过这些数据集的实验,我们可以观察到DMF-MobileMamba在分类准确率、计算效率和实时性方面的表现。
在研究结论部分,本文设计了一种基于引导增强的轻量级双流特征融合医疗图像多疾病适应分类网络(DMF-MobileMamba),该网络采用了结构解耦和梯度隔离策略。通过将CNN的局部感知优势与Mamba的全局建模能力分别用于独立特征提取,显著提升了后续特征互补性的效率。此外,DMF-MobileMamba在六个医疗数据集上的表现均优于主流先进模型,证明了其在医疗图像分类任务中的有效性。
在作者贡献部分,Wenlong Shi主要负责撰写原始草稿、可视化、验证、软件开发、项目管理、方法论研究和调查分析。Long Yu则参与了撰写与编辑、监督和数据管理。Shengwei Tian负责撰写与编辑和监督。Qimeng Yang参与了撰写与编辑和监督。Dezhi Zhang负责监督和数据管理。Shirong Yu则负责监督、调查和数据管理。Weidong Wu负责监督、形式分析和数据管理。
在竞争利益声明部分,作者声明他们没有已知的财务利益或个人关系可能影响本文报告的研究成果。
在致谢部分,我们感谢中国国家自然科学基金(项目编号:62362061)、天山英才培养计划(项目编号:2023TSYCLJ0023)以及新疆维吾尔自治区重点研发计划(项目编号:2021B03001-4)的支持。这些支持为本研究提供了必要的资金和资源,使我们能够顺利完成模型的开发与实验。
综上所述,本文提出了一种基于引导增强的轻量级双流多尺度特征融合医疗图像多疾病适应分类网络——DMF-MobileMamba。该网络通过结构解耦和梯度隔离策略,有效结合了CNN的局部感知能力和Mamba的全局建模能力,从而提升了特征互补性的效率。同时,通过引入多尺度注意力调制融合模块和跨层级引导增强注意力模块,实现了对局部与全局特征的动态融合与校正,显著提高了模型的分类准确率。实验结果显示,DMF-MobileMamba在六个医疗数据集上均表现出优于主流先进模型的性能,同时保持了较低的计算成本和较高的推理速度,为资源受限场景提供了高精度、低成本的解决方案。本文的研究成果不仅为医疗图像分类提供了新的方法,也为边缘计算环境下的智能诊断系统设计提供了重要的参考。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号