
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多维注意力与风车卷积的新型残差网络在脑肿瘤分类中的突破性应用
【字体: 大 中 小 】 时间:2025年08月25日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对脑肿瘤早期诊断中传统卷积神经网络(CNN)特征提取能力有限、关键信息关注不足的难题,创新性地提出Res-MAPNet模型。通过Coordinated Local Importance Enhancement Attention (CLIA)模块和Pinwheel-Shaped Attention Convolution (PSAConv)模块的协同设计,在公开MRI数据集上实现三分类99.51%、四分类98.01%的准确率,为临床计算机辅助诊断系统提供了高效解决方案。
在医学影像诊断领域,脑肿瘤的早期准确分类直接关系到临床治疗方案的选择和患者预后。尽管磁共振成像(MRI)能提供高分辨率图像,但传统计算机辅助诊断(CAD)系统仍面临两大挑战:一是基于手工特征的机器学习方法(如SVM、KNN)依赖专家经验且耗时;二是主流卷积神经网络(CNN)存在固定感受野、池化层信息丢失等问题,难以有效捕捉复杂病灶特征。尤其当面对多类别分类任务时,现有模型在泛化能力和计算效率之间难以平衡,这促使Jincan Zhang团队在《Scientific Reports》发表创新性研究成果。
为解决上述问题,研究人员开发了基于多维注意力与风车卷积的残差网络(Res-MAPNet)。关键技术包括:1) 使用Figshare和Kaggle公开MRI数据集,通过随机尺度裁剪和水平翻转进行数据增强;2) 设计CLIA模块整合通道注意力、空间注意力与方向感知位置编码;3) 采用PSAConv模块通过非对称填充和分组卷积扩大感受野;4) 在ConvNeXt基线网络上引入改进的残差连接结构。
Coordinated Local Importance Enhancement Attention
CLIA模块通过SoftPool下采样和3×3卷积生成重要性图谱,结合Coordinate Attention(CA)的双向特征编码机制,使模型能动态聚焦病灶区域。实验显示该模块单独使用可使基线模型准确率提升2.12%(三分类)和2.76%(四分类)。
Pinwheel-Shaped Attention Convolution
PSAConv创新性地将1×3和3×1卷积核与CA注意力结合,参数量仅为传统卷积的1/3。其非对称填充策略显著增强空间特征感知,在四分类任务中使模型特异性达99.6%。
实验结果验证
在3264例MRI数据的四分类任务中,模型对垂体瘤的召回率达98.9%,但对脑膜瘤的分类存在4例误判(主要误分为胶质瘤)。Grad-CAM可视化证实模型关注区域与真实病灶高度吻合。与EfficientNetV2等模型相比,Res-MAPNet在保持16.41M参数量的同时,推理时间仅1.14ms/图像,内存占用降低35%。
这项研究的意义在于:首先,CLIA-PSAConv的协同设计为医学图像分析提供了新的特征提取范式,其99.51%的三分类准确率超越现有主流模型;其次,模型在保持轻量化的同时解决了Transformer架构计算成本高的问题,更适合临床环境部署;最后,研究揭示方向感知编码对垂体瘤检测的特异性提升作用,为后续研究指明方向。作者也指出,相比DenseNet等轻量模型,参数压缩仍有优化空间,未来可通过知识蒸馏等技术进一步适配移动终端。



生物通微信公众号
知名企业招聘