深度学习在数字病理图像分类中自动标注与人工标注等效性研究及其临床应用价值

【字体: 时间:2025年07月25日 来源:Journal of Oral Biosciences 2.6

编辑推荐:

  本研究针对数字病理图像分析中人工标注耗时耗力的问题,通过对比卷积神经网络(CNN)和视觉Transformer(ViT)在三种癌症(乳糜泻、肺癌、结肠癌)10′604张全切片图像(WSI)上的表现,证实当自动标注错误率≤10%时,基于语义知识提取工具(SKET)的自动标注可达到与人工标注相当的分类性能(F1-score:0.906/0.757/0.833),为大规模病理数据集构建提供了高效解决方案。

  

在医疗AI快速发展的今天,数字病理图像的精准分类仍面临标注瓶颈——每张全切片图像(WSI)需要病理专家耗费30分钟进行人工标注。尽管弱标注(图像级标签)可将标注时间缩短至30秒,但医学报告分析的复杂性仍导致自动标注存在噪声。如何平衡标注效率与模型性能,成为制约病理AI规模化应用的关键难题。

针对这一挑战,来自的研究团队在《Journal of Oral Biosciences》发表突破性研究。他们系统评估了自动标注在三种典型病理场景中的有效性:采用二进制标签的乳糜泻、多类标签的肺癌(SCLC/LUAD/LUSC)以及多标签的结肠癌(含HGD/LGD等)。研究创新性地通过两种验证路径:先随机扰动人工标签模拟1-50%噪声梯度,再用SKET工具实际提取报告标签,最终在10′604张WSI上验证了自动标注的可靠性。

关键技术路线包含:1) 多中心WSI预处理(意大利Catania队列和荷兰Radboud大学医学中心的3DHistech/Aperio扫描图像);2) 三架构对比(CLAM-SB/MB、transMIL、ViT);3) 自监督预训练(simCLR用于CNN,DINO v2用于ViT);4) 10折交叉验证(按患者划分确保独立性)。实验特别设计了噪声耐受测试,在二进制/多类/多标签场景中分别采用标签翻转、类别替换和多标签修改策略。

【自动标注效能】SKET在三大病种的标签提取F1-score达0.944-0.976,单报告处理仅需0.006-0.03秒,较人工效率提升333倍。尤其值得注意的是,结肠癌多标签场景中SKET对"高级别异型增生(HGD)"等复杂概念的识别准确率达0.961。

【分类性能边界】噪声实验揭示关键阈值:二进制分类(乳糜泻)容忍10%噪声时F1-score保持0.906±0.014;多类(肺癌)和多标签(结肠癌)场景在20%噪声下仍维持0.759±0.012和0.829±0.009。超过阈值后性能显著下降(p<0.05),如50%噪声时乳糜泻分类F1-score暴跌至0.480±0.141。

【架构对比】ViT展现最强鲁棒性,在肺癌多类分类中F1-score达0.763±0.012,显著优于CLAM(0.674±0.016)和transMIL(0.696±0.016)。但在结肠癌多标签任务中,三架构差异缩小(ViT:0.831±0.009 vs transMIL:0.791±0.008),提示多标签任务对架构选择性较低。

这项研究确立了自动标注在数字病理中的黄金标准:当错误率控制在10%(二进制)或20%(多类/多标签)以内时,基于NLP的自动标注可完全替代人工。这不仅使万级WSI数据集构建时间从83小时压缩至5分钟,更开创了"报告-WSI"双模态分析新范式。特别在结肠癌等需同时检测腺癌(adenocarcinoma)、低级别异型增生(LGD)等多标签场景,该成果为复杂病理特征的自动化筛查提供了可推广的解决方案。随着实验室信息系统(LIS)的智能化升级,这项技术将加速病理AI从单中心验证向多中心临床应用转化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号