基于增强型分层注意力机制的混合多示例学习模型在自动Gleason分级与评分中的应用研究

【字体: 时间:2025年05月09日 来源:Scientific Reports 3.8

编辑推荐:

  针对前列腺癌病理图像标注成本高且标签噪声大的问题,海南大学等团队提出融合分层注意力机制的混合多示例学习(MIL)模型。该研究通过SLIC超像素分割和SEPPEG位置编码,在SICAPv2和TMAs数据集上分别实现0.9597/0.8889的AUC值,为Gleason分级系统提供了兼具全局上下文感知与局部特征识别的智能诊断方案。

  

论文解读

前列腺癌作为男性第二大高发癌症,其诊断金标准Gleason分级系统依赖病理学家对组织形态的主观评估。然而传统方法面临三重困境:全切片图像(WSI)标注需要耗费病理学家数百小时;组织微阵列(TMA)核心样本存在标注噪声;现有AI模型难以同步捕捉癌变区域的全局分布模式与局部细胞特征。这种"标注难-噪声大-建模浅"的现状严重制约了精准医疗的发展。

海南大学牵头的研究团队在《Scientific Reports》发表的研究中,创新性地将增强型分层注意力机制融入混合多示例学习框架。该模型通过MobileNetV2预训练网络提取超像素特征,结合区域邻接图(RAG)构建组织图谱,采用SEPPEG位置编码增强空间感知。双分支架构中,SlideAtt分支通过全局注意力建模整张切片语义,InsAtt分支则通过随机掩码策略过滤噪声标签,最终在SICAPv2和TMAs数据集上超越TransMIL等基线模型9.2%-26.3%的K-score值。

关键技术方法
研究采用SLIC算法将WSI分割为200个超像素块,通过MobileNetV2提取1280维特征。位置编码模块SEPPEG融合3种不同尺寸卷积核的特征,结合压缩激励(SE)块增强通道依赖性。模型使用Ranger优化器(学习率2e-4)在PyTorch-Lightning框架下训练,采用四折交叉验证策略,测试集包含244例TMA核心和39例WSI样本。

主要研究结果

  1. 多尺度特征融合性能
    通过比较傅里叶嵌入、PPEG等5种位置编码方法,SEPPEG在TMAs数据集上取得0.8889 AUC值,较基线最高提升18.9%。其关键在于多尺度卷积核捕获不同层次的形态学特征,而SE块使模型聚焦于关键腺体结构通道。

  2. 分层注意力机制有效性
    双分支架构中,SlideAtt分支通过κ=0.7779的K-score准确识别主要Gleason模式(3/4/5),InsAtt分支则精确定位筛状结构等局部特征。混淆矩阵显示,对GS7(3+4)与GS7(4+3)的鉴别准确率达89.6%,显著优于病理学家目视评估。

  3. 跨数据集鲁棒性验证
    在标注质量差异显著的SICAPv2(像素级标注)和TMAs(弱标注)数据集上,模型AUC差值仅7.08%,证明随机掩码策略有效缓解了标签噪声。超参数敏感性分析表明,当学习率为1e-4、超像素数=200时达到最优平衡。

研究结论与展望
该研究首次实现Gleason分级中全局组织构型与局部细胞特征的协同建模。SEPPEG编码使模型能识别癌变区域的空间过渡特征(如Gleason3到4的渐变区域),而分层注意力机制将病理学家的"定位-分析"诊断逻辑转化为可计算的深度学习框架。未来工作将探索半监督学习策略,结合少量像素级标注样本进一步提升TMA数据的分析精度。

值得注意的是,模型在TMAs数据集上对GS6样本的识别偏差(准确率低12.7%)反映出小尺寸样本的局限性。这提示临床应用中需针对穿刺活检与根治术标本开发差异化的分析策略。该成果不仅为前列腺癌智能诊断设立新基准,其混合监督框架更可拓展至乳腺癌、胃癌等需多尺度分析的病理场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号