
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于注意力机制的全切片图像压缩技术实现多器官常规活检病理级预筛查
【字体: 大 中 小 】 时间:2025年06月25日 来源:Modern Pathology 7.1
编辑推荐:
研究人员针对癌症筛查项目中组织病理学分析需求激增的问题,开展基于注意力机制神经图像压缩(NIC-A)的全切片图像(WSI)分类研究。通过开发"切片打包"技术和弱监督学习框架,在12,580张WSI上验证了模型对结肠、宫颈和十二指肠活检的异常检测能力,结果显示其分类性能达到病理专家水平,为常规数字病理诊断工作流提供了有效的预筛查工具。
随着结直肠癌和宫颈癌等筛查项目的普及,组织病理活检样本数量呈现爆发式增长。传统病理学家对数字全切片图像(Whole-Slide Image, WSI)的视觉检查诊断过程不仅耗时耗力,还面临着观察者内和观察者间差异的挑战。更关键的是,筛查数据中绝大多数样本实际上并无临床异常,这促使研究者思考:能否通过人工智能技术优化诊断流程,减轻病理学家的工作负担?
荷兰拉德堡德大学医学中心等机构的研究团队在《Modern Pathology》发表的研究给出了肯定答案。该研究创新性地将注意力机制与神经图像压缩(Neural Image Compression with Attention, NIC-A)相结合,开发出能同时处理结肠、宫颈和十二指肠活检的多功能诊断框架。特别值得注意的是,该方法仅需使用病理报告中提取的幻灯片级别标签进行弱监督学习,避免了传统方法所需的繁琐人工标注。
研究团队采用三项关键技术:首先开发"切片打包"算法,将同一组织块的多张切片合并为单张"打包"图像;其次评估7种预训练编码器的特征提取能力;最后构建注意力分类器实现组织亚型识别。实验数据来自荷兰和意大利两家医疗中心的12,580张WSI,涵盖9,141个组织块。
在材料与方法部分,研究设置了结肠、宫颈和十二指肠活检三个独立评估队列。通过矩形打包算法将多张WSI合并为宏WSI,存储需求降低65%。比较发现,基于Barlow Twins预训练的ResNet50在结肠分类任务表现最佳(AUC=0.969),而DINO预训练的视觉变换器(ViT)最适合宫颈分类(AUC=0.888)。
研究结果显示,NIC-A-colon与病理专家共识达成高度一致(二次加权Kappa=0.75),对ASP外部数据的分类准确率保持稳定。值得注意的是,模型表现出过度分级倾向,将部分低级别异型增生(LGD)归类为高级别异型增生(HGD),这种保守特性使其特别适合预筛场景。宫颈分类任务中,模型与Radboudumc数据共识的Kappa值达0.82,但跨中心性能有所下降,反映宫颈病变诊断的固有复杂性。
在十二指肠活检的乳糜泻(Celiac Disease, CD)检测中,ImageNet预训练的ResNet50表现最优(AUC=0.986)。虽然未进行读者研究,但模型与原始报告的一致性Kappa值达0.52,展示了跨组织类型的泛化能力。通过注意力可视化可发现,模型能准确定位异常组织区域,为病理学家提供可解释的诊断依据。
讨论部分指出,该研究的突破性在于首次实现单一框架处理多器官活检分类,且性能媲美病理专家。采用的自监督预训练编码器在不同任务中表现优异,表明数据量和训练方式比网络架构更重要。尽管存在局限(如对锯齿状息肉等特殊病变的识别不足),但该技术已展现出显著的临床转化价值,特别是在病例分诊方面,能确保异常病例不被漏诊。
这项研究为数字病理诊断提供了创新解决方案,其弱监督学习框架大幅降低了人工智能应用门槛。随着更多病变类型的纳入和更大规模验证的开展,这种基于注意力机制的WSI分析技术有望重塑病理诊断工作流程,在保证诊断质量的同时显著提升筛查效率。未来研究可探索结合免疫组化(IHC)等补充数据,进一步扩展自动化诊断的范围和准确性。
生物通微信公众号
知名企业招聘