基于VGG19-U-Net迁移学习的脑肿瘤MRI图像分割增强研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Medical Imaging》：A brain tumor segmentation enhancement in MRI images using U-Net and transfer learning

【字体：大中小】 时间：2025年08月01日 来源：BMC Medical Imaging 3.2

编辑推荐：

　　本研究针对脑肿瘤MRI图像分割精度不足的难题，创新性地提出采用VGG19预训练网络作为U-Net编码器的迁移学习方案。通过TCGA-LGG数据集验证，模型取得AUC 0.9957、Dice系数0.9679等突破性指标，显著优于传统U-Net及其他预训练变体，为临床诊断提供高精度AI辅助工具。

脑肿瘤作为最具威胁的神经系统疾病之一，其早期精准诊断直接关系到患者生存率。尽管磁共振成像(MRI)已成为临床诊断金标准，但传统人工勾画存在耗时、主观性强等问题，而现有AI模型对肿瘤异质性和边界模糊区域的识别仍存瓶颈。尤其当面对TCGA（The Cancer Genome Atlas）数据库中低级别胶质瘤这类浸润性生长的肿瘤时，现有算法的分割性能往往急剧下降。

为突破这一技术壁垒，研究人员开发了基于VGG19预训练网络的U-Net改进架构。通过固定VGG19编码器的预训练权重，结合创新的Focal Tversky损失函数（参数α=0.7，γ=0.75），该模型在TCGA-LGG数据集120例患者FLAIR序列MRI图像上实现了突破性进展。相关成果已发表于《BMC Medical Imaging》。

关键技术包括：1) 采用VGG19作为U-Net编码器进行迁移学习；2) 设计包含跳跃连接(skip connections)的对称编解码结构；3) 应用Focal Tversky损失函数解决类别不平衡问题；4) 使用256×256像素标准化输入的定制数据生成器。

【数据采集与预处理】

研究选用TCIA（The Cancer Imaging Archive）公开的TCGA-LGG数据集，包含120例WHO II-III级胶质瘤患者的FLAIR序列MRI。通过分层抽样将数据划分为训练集(70%)、验证集(15%)和测试集(15%)，并采用批量归一化(batch normalization)稳定0.05的高学习率训练过程。

【模型架构创新】

如图3所示，模型创新性地将VGG19的16层卷积网络作为编码器，与U-Net解码器通过跳跃连接融合。这种设计既保留了VGG19在ImageNet上学习到的通用特征提取能力，又通过U-Net的上采样路径恢复了空间细节。消融实验证实，移除跳跃连接会使IoU下降26.42%，改用VGG16则导致Dice系数降低30.15%。

【性能突破】

如表3所示，该模型在全部6项指标上创下新高：AUC 0.9957（较传统U-Net提升6.09%）、Dice系数0.9679（提升9%）、IoU 0.9378（提升15.25%）。图8直观展示了其在边界模糊区域的细分优势，而图9-14的训练曲线证实了模型快速收敛特性。

【临床价值】

该研究首次证实固定预训练权重的VGG19-U-Net组合在脑肿瘤分割中的卓越性能。其0.9821的召回率(recall)意味着极低的漏诊风险，而0.9541的精确度(precision)则可减少假阳性对临床决策的干扰。研究同时揭示了年龄与预后的相关性（图2），30-40岁患者虽确诊集中但死亡率较高，提示该模型对年轻患者群体的特殊价值。

未来研究将向三个方向拓展：1) 整合T1/T2等多模态MRI数据；2) 迁移至BraTS等三维数据集；3) 探索Vision Transformer等新型架构。这些进展将推动AI辅助诊断从实验室向临床实践转化，最终实现"数字病理学家"的愿景。

联系信箱：

粤ICP备09063491号

热点排行