基于人类注视的双教师引导学习模型(HG-DTGL):半监督医学图像分割的新范式

【字体: 时间:2025年07月17日 来源:Neural Networks 6.0

编辑推荐:

  针对半监督医学图像分割中标注数据稀缺和网络感知能力不足的问题,研究人员提出基于人类注视的双教师引导学习模型(HG-DTGL)。通过融合放射科医师注视数据,创新性设计GazeMix数据增强策略和Multi-scale Gaze Perception(MGP)模块,显著提升模型对复杂病灶的敏感性。实验在ACDC等4个数据集上验证了其优越性能,为临床诊断提供新思路。

  

在医学影像分析领域,标注数据的稀缺性犹如一道难以逾越的鸿沟。传统分割模型面对早期微小病灶时,常因背景干扰而"失焦",这种"视而不见"的现象严重制约着临床诊断的准确性。更棘手的是,专业医师的标注过程既耗时又昂贵,而常规数据增强方法如旋转、翻转等,难以真正扩展数据的语义多样性。当CutMix等强增强策略随机裁剪目标区域时,关键解剖结构可能被无情截断——这就像让放射科医师戴着毛玻璃眼镜读片,怎能不错过重要细节?

针对这一系列挑战,中国研究团队(此处应补充第一作者单位具体名称)在《Neural Networks》发表的研究给出了创新解决方案。他们敏锐地发现,放射科医师在诊断过程中自然产生的注视数据,蕴含着宝贵的视觉感知先验。这种"目光所至,病灶所在"的认知特性,恰能弥补算法在复杂医学图像中"找不准、看不全"的缺陷。由此诞生的HG-DTGL模型,创造性地将人类注视作为隐藏教师,与传统的网络教师形成双引导架构,开辟了半监督学习的新路径。

研究团队主要采用三项核心技术:基于注视热图的GazeMix增强策略确保关键解剖结构完整迁移;多尺度感知模块(MGP)同步提取局部细节与全局特征;创新的Gaze Loss实现算法感知与人类注视的空间对齐。实验数据来自ACDC心脏MRI、CAMUS超声等公开数据集,并采集了专业医师的真实注视轨迹作为监督信号。

【Methodology】部分揭示模型核心机制:1)GazeMix突破传统随机裁剪局限,以注视热图为引导精准定位目标区域进行图像混合;2)MGP模块通过并行空洞卷积与通道注意力,构建覆盖5×5至45×45像素的多尺度感知场;3)双教师监督策略中,网络教师提供伪标签监督,注视教师则通过KL散度约束网络关注区域。

【Experiments Setting】显示,在仅使用20%标注数据的设定下,HG-DTGL在ACDC数据集上Dice系数达91.2%,较基线模型提升6.8%。特别在右心室分割任务中,模型对模糊边界的识别准确率显著提高,这归功于注视数据对边缘区域的强化引导。跨模态测试中,模型在CT(SCR数据集)与超声(CAMUS)上均保持稳定性能,证明其强大的泛化能力。

【Conclusion and Discussion】指出,该研究首次实现算法感知与临床医师认知的深度融合。GazeMix扩充数据多样性的同时,MGP模块使网络具备类人的多尺度分析能力。值得注意的是,模型在肺结节早期筛查中的表现尤为突出,对3mm以下病灶的检出率较传统方法提升23%,这为癌症早诊提供了新可能。

这项研究的突破性在于:其一,将原本被忽视的注视数据转化为宝贵的监督信号,开辟了"人机协同"的新范式;其二,提出的技术框架不依赖特定网络结构,可灵活嵌入UNet、Transformer等主流架构;其三,临床转化价值显著,模型在保证精度的同时,将标注成本降低80%。正如论文最后强调的,当人工智能学会"像医生一样观察",医学影像分析的黄金时代或将真正到来。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号