
-
生物通官微
陪你抓住生命科技
跳动的脉搏
NeXtBrain:融合局部与全局特征学习的脑肿瘤分类新方法——突破深度学习在医学影像诊断中的效率与精度瓶颈
【字体: 大 中 小 】 时间:2025年06月09日 来源:Brain Research 2.7
编辑推荐:
本研究针对脑肿瘤MRI分类中局部特征捕获与全局上下文建模难以兼顾的挑战,提出新型混合架构NeXtBrain,创新性整合NeXt卷积块(NCB)和NeXt Transformer块(NTB),在Figshare和Kaggle数据集上分别实现99.78%准确率,以仅23.91M参数量超越DeiT3-Base等大型模型,为临床实时诊断提供高效解决方案。
脑肿瘤的精准诊断是神经肿瘤学领域的重大挑战。尽管磁共振成像(MRI)能提供高分辨率解剖图像,但人工解读存在主观性强、效率低等问题。当前基于深度学习的计算机辅助诊断(CAD)系统虽取得进展,但传统卷积神经网络(CNN)难以同时捕捉细微的局部肿瘤形态和长程空间依赖关系,而纯Transformer架构又因计算复杂度高难以临床落地。这种"局部与全局不可兼得"的困境,加上医疗场景对模型轻量化的严格要求,成为制约AI辅助诊断发展的关键瓶颈。
针对这一难题,研究人员开发了创新性混合架构NeXtBrain。该研究通过系统整合CNN的局部特征提取优势与Transformer的全局建模能力,在Figshare和Kaggle两个公开脑MRI数据集上实现突破性性能:分类准确率均达99.78%,F1-score分别达99.77%和99.81%,显著超越17种当前最优模型。尤为重要的是,该模型仅需23.91百万参数和10.32 GFLOPs运算量,推理时间快至0.007毫秒,为临床实时应用扫清障碍。相关成果发表在《Brain Research》,为医学影像分析领域树立了新标杆。
研究采用三大关键技术方法:1) 设计NeXt卷积块(NCB),采用深度可分离卷积替代传统组卷积,结合多头卷积注意力(MHCA)和SwiGLU激活的多层感知机(MLP),优化局部特征学习;2) 开发NeXt Transformer块(NTB),通过高效多头自注意力(E-MHSA)与MHCA的并联结构实现多频率特征融合;3) 基于7022例Kaggle数据集和3064例Figshare数据集的严格交叉验证,采用在线数据增强和迁移学习策略。
研究结果部分显示:
讨论部分指出,NeXtBrain的创新价值体现在三方面:首先,MHCA与SwiGLU-MLP的组合首次在医学影像中实现局部-全局特征的无损融合;其次,深度可分离卷积与注意力机制的协同设计,使模型在保持ViT级性能的同时,参数量仅为Swin-Base的27.6%;最后,10.32 GFLOPs的超低计算需求,使其成为首个有望部署在移动设备的医疗级Transformer模型。
该研究的临床意义在于:1) 为"小样本高精度"的医学影像分析提供新范式;2) 其<10ms的实时推理能力可集成至PACS系统辅助诊断;3) 模块化设计为其他医学图像分类任务提供可扩展框架。未来工作将聚焦于多中心验证和可解释性提升,推动AI辅助诊断从实验室走向临床实践。
生物通微信公众号
知名企业招聘