
-
生物通官微
陪你抓住生命科技
跳动的脉搏
高效融合UNet-SegNet与视觉Transformer:医学图像分割与分类的创新架构研究
【字体: 大 中 小 】 时间:2025年07月09日 来源:Physical and Engineering Sciences in Medicine 2.4
编辑推荐:
为解决医学图像分割与分类中存在的低对比度、噪声及不规则解剖结构挑战,研究人员提出了一种新型混合深度学习模型,整合了卷积自编码器(CAE)、UNet和SegNet架构。通过Dynamic Feature Fusion和HEPO特征选择,结合HyViT-CE分类器,在脑肿瘤MRI、乳腺超声和胸X光数据集上实现99.92%以上准确率,为临床诊断提供高可靠性工具,推动深度学习在医学影像的应用。
医学成像已成为诊断和治疗各种疾病的关键工具,通过超声、MRI和X光等模态提供宝贵洞察。然而,低对比度、噪声干扰和不规则解剖形状等因素,使得复杂结构的分割与分类面临严峻挑战。本研究提出一种创新混合深度学习模型,巧妙融合了卷积自编码器(CAE)、UNet和SegNet的优势。在预处理阶段,CAE高效去除噪声,同时保留关键图像细节,确保后续分析输入高质量数据。模型利用UNet进行多尺度特征提取,SegNet负责精确边界重建,并通过Dynamic Feature Fusion在编码器-解码器跳跃连接中动态加权融合特征图,从而有效捕获全局与局部特征,并突出分割关键区域。为提升性能,引入Hybrid Emperor Penguin Optimizer(HEPO)进行特征选择,并采用Hybrid Vision Transformer with Convolutional Embedding(HyViT-CE)执行分类任务,使模型在不同医学成像任务中保持高精度。评估基于三大数据集:脑肿瘤MRI、乳腺超声和胸X光,结果显示模型表现卓越:脑肿瘤分割准确率达99.92%,乳腺癌检测为99.67%,胸X光分类高达99.93%。这些成果证实了模型在多样化医疗场景中提供可靠诊断的潜力,有望成为临床实践中的有力工具,助力患者护理提升。
生物通微信公众号
知名企业招聘