基于深度Transformer编码器与扩张卷积全局注意力机制的口腔鳞状细胞癌分级分类研究

《Frontiers in Artificial Intelligence》:Oral squamous cell carcinoma grading classification using deep transformer encoder assisted dilated convolution with global attention

【字体: 时间:2025年10月18日 来源:Frontiers in Artificial Intelligence 4.7

编辑推荐:

  本文提出了一种创新的深度学习框架DeTr-DiGAtt(深度Transformer编码器辅助扩张卷积全局注意力模型),用于口腔鳞状细胞癌(OSCC)的组织病理学图像分级。该研究通过生成对抗网络(GAN)进行数据增强,采用自适应双边滤波(Ad-BF)进行图像预处理,利用改进的多编码器残差压缩U-Net(Imp-MuRs-Unet)实现精准分割,结合集成VGG与MobileNet(VGG-Mob)进行特征提取,最终通过自适应灰雁优化算法(Ad-GreLop)优化分类器超参数。实验结果表明,该方法在准确率(ACC)、Dice系数和交并比(IoU)等指标上均显著优于现有技术,为OSCC的自动化诊断提供了可靠解决方案。

  
数据增强与预处理
研究采用生成对抗网络(GAN)解决数据集有限和类别不平衡问题。通过生成器(C)和判别器(E)的对抗训练,显著扩充了样本数量。预处理阶段使用自适应双边滤波(Ad-BF)替代传统高斯滤波,有效去除噪声并保留边缘细节。该滤波器通过空间域和强度域的双重权重计算,实现了更优的降噪效果。
改进的多编码器残差压缩U-Net分割模型
针对现有分割方法存在的边缘模糊和耗时过长问题,提出Imp-MuRs-Unet模型。该模型引入通道注意力机制和空间注意力机制,通过挤压激励(SE)模块优化特征融合。编码器部分采用多层感知机(MLP)和多头自注意力(MHA)模块,解码器结合跳跃连接和残差结构,显著提升了缺血性卒中区域的分割精度。实验显示,该模型在交并比(IoU)和Dice系数上分别达到98.08%和97.97%,优于U-Net+ResNet等对比模型。
集成VGG与MobileNet的特征提取
提出VGG-Mob混合架构,结合VGG16的深层特征提取能力和MobileNetV2的轻量化设计。采用深度可分离卷积(Depthwise Separable Convolution)分解标准卷积操作,通过逆残差结构和线性瓶颈层优化特征流。ReLU6激活函数的引入进一步保障了低精度计算下的数值稳定性,使模型能够高效捕获肿瘤区域的纹理、形状和颜色强度特征。
深度Transformer编码器辅助扩张卷积全局注意力分类器
DeTr-DiGAtt模型融合了Transformer编码器的长序列建模能力和扩张卷积的多尺度特征捕获优势。通过层归一化(LN)和凝胶(GELU)激活函数稳定训练过程,利用全局注意力机制加权关键特征。扩张卷积通过调整膨胀率(m)扩大感受野而不损失分辨率,有效克服了传统CNN的局部性限制。超参数优化采用改进的自适应灰雁优化算法(Ad-GreLop),通过混沌映射(ch)增强种群多样性,使准确率提升至98.59%。
性能验证与对比分析
在包含80张口腔组织病理图像的数据集上进行了五折交叉验证。与AlexNet、XceptionNet等模型对比,DeTr-DiGAtt在准确率(98.59%)、精确率(97.53%)、召回率(98.45%)和特异性(98.96%)等指标上均取得最优结果。混淆矩阵显示其对中分化、低分化和高分化OSCC的误判率显著降低。统计检验(p<0.05)证实性能提升具有显著性。
技术优势与临床意义
该框架通过端到端的深度学习流程,解决了传统诊断中依赖病理医生经验、存在观察者差异的问题。多阶段设计的协同作用有效克服了数据稀缺、类间变异和复杂组织结构等挑战,为OSCC的早期精准分级提供了自动化工具,具有重要的临床转化价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号