病理基础模型与多示例学习融合策略显著提升肾脏疾病诊断效能

【字体: 时间:2025年10月11日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对肾脏疾病病理诊断依赖专家经验、分析效率低下的问题,开展了基于病理基础模型与多示例学习(MIL)的肾脏病理分析研究。通过整合242张H&E染色全切片图像(WSI)作为开发队列,并采用83张外部验证图像,研究发现UNI、Virchow等病理基础模型作为特征提取器时,其疾病分类AUROC均超过0.980,且在外部队验证中显著优于ImageNet预训练的ResNet50模型。该研究为肾脏病理的自动化分析提供了鲁棒性强、可解释性高的新范式,对推动数字病理临床应用具有重要意义。

  
在肾脏疾病诊断领域,病理学家需要通过显微镜观察组织切片中的复杂特征——从肾小球的结构异常到肾小管间的炎症浸润,这些细微的差异往往决定着治疗方案的选择与患者的预后。然而,这种依赖人工判读的传统模式正面临着巨大挑战:一方面,专业病理医师的培养周期长且资源有限;另一方面,全切片图像(Whole Slide Image, WSI)的数据量极其庞大,单张切片即可达到数十亿像素级别,使得全面、精准的分析变得异常困难。
近年来,深度学习技术为数字病理带来了新的曙光。特别是基于卷积神经网络(CNN)的方法已在肾脏结构分割、病变定量分析等方面取得显著进展。但这类方法存在一个关键瓶颈:它们高度依赖大量人工标注数据用于监督学习,而绘制详细的病理标注需要耗费专家数百小时的工作量,严重制约了其大规模应用潜力。更值得关注的是,当模型面临不同医疗机构采用的染色协议差异时,其性能往往出现显著下降。
与此同时,自监督学习(Self-Supervised Learning, SSL)技术的突破催生了一类新型的"病理基础模型"。这些模型通过在海量未标注病理图像上进行预训练,学会了提取具有高度判别力的视觉特征。与CNN模型相比,基于视觉Transformer(Vision Transformer, ViT)架构的基础模型具有更少的归纳偏置,使其能够更好地利用大规模数据,在各种下游任务中展现出卓越性能。
那么,这些新兴的病理基础模型能否真正改变肾脏疾病的诊断范式?来自日本东京大学研究生院医学系研究科的研究团队在《Scientific Reports》上发表了他们的最新研究成果。该研究创新性地将病理基础模型与多示例学习(Multiple Instance Learning, MIL)框架相结合,旨在开发一种无需精细标注即可实现精准诊断的智能分析系统。
研究团队首先构建了一个包含242张H&E染色WSI的开发队列,数据来源于肾脏精准医学项目(Kidney Precision Medicine Project, KPMP)和日本病理人工智能诊断项目(Japan-Pathology Artificial Intelligence Diagnostics Project, JP-AID)数据库。队列包括47例健康对照(Healthy Control, HC)、35例急性间质性肾炎(Acute Interstitial Nephritis, AIN)和160例糖尿病肾病(Diabetic Kidney Disease, DKD)切片。外部验证集则来自东京大学医院的83张WSI。
在技术方法上,研究采用了多示例学习这一弱监督学习框架。每个WSI被划分为256×256像素的图像块,经过背景过滤后,使用七种不同的预训练编码器(包括ResNet50和六种病理基础模型:UNI、UNI2-h、Prov-Gigapath、Phikon、Virchow和Virchow2)提取特征向量。随后,通过四种MIL聚合方法(最大池化、注意力机制MIL、Transformer MIL和聚类约束注意力MIL)整合块级特征,最终实现切片级别的疾病分类。特别值得一提的是,研究还探索了模型对显性蛋白尿(overt proteinuria)的预测能力,定义为尿蛋白≥1000 mg/gCre或尿白蛋白≥300 mg/gCre。
模型开发与内部验证
在开发队列中,所有病理基础模型均显著优于ImageNet预训练的ResNet50。特别是在使用聚类约束注意力多示例学习(CLAM)作为聚合方法时,模型表现最为稳定,AUROC均超过0.980。相比之下,最大池化法的性能相对较低,这表明在肾脏病理分析中,加权聚合策略比单纯关注最显著图像块更为有效。
外部验证表现
当模型应用于来自不同机构的验证集时,ResNet50的性能出现明显下降,而病理基础模型则保持了较强的鲁棒性。值得注意的是,UNI、UNI2-h、Virchow和Virchow2模型即使在不进行染色标准化的条件下,仍能保持优异性能,这在实际临床应用中具有重要价值,因为不同医疗机构的染色差异是常见现象。
模型可视化分析
通过生成注意力热图,研究人员深入探索了模型的决策逻辑。在健康对照分类中,多数模型重点关注健康肾小管结构;而在AIN诊断中,模型成功识别了间质炎症细胞浸润区域;对于DKD,Virchow和Virchow2模型特别关注了肾小球的病理改变。这种可解释性不仅增强了临床医生对模型的信任,也为理解疾病的关键病理特征提供了新视角。
蛋白质尿预测探索
在探索性分析中,研究团队使用DKD病例评估了模型预测显性蛋白尿的能力。结果显示,病理基础模型同样优于ResNet50,其中UNI2-h表现最佳(AUROC=0.872)。注意力热图分析表明,UNI2-h模型能够准确聚焦于与蛋白尿相关的关键病变区域,如肾小球系膜基质扩张和结节性病变。
本研究证实了病理基础模型在肾脏病理分析中的巨大潜力。与传统的ImageNet预训练模型相比,这些专门针对病理图像设计的基础模型不仅具有更高的诊断准确性,还表现出更强的泛化能力和鲁棒性。多示例学习框架的成功应用表明,无需精细的块级标注即可实现有效的切片级分类,这大大降低了模型开发的数据标注成本。
值得注意的是,不同病理基础模型在关注焦点上存在差异:Virchow系列模型更倾向于识别肾小球病变,而其他模型可能更关注小管间质改变。这种差异提示我们,未来可根据具体临床任务选择合适的特征提取器。此外,模型对染色变异性的强健性使其更适用于多中心研究,有望推动肾脏病理诊断的标准化进程。
当然,研究也存在一定局限性,如健康对照主要来自移植肾活检样本,可能包含缺血再灌注损伤的改变;疾病类型相对有限,未涵盖IgA肾病等更常见的肾小球疾病。但无论如何,这项研究为数字病理在肾脏疾病中的应用开辟了新途径,为开发更加智能、高效的病理辅助诊断系统奠定了坚实基础。随着更多多中心数据的积累和模型优化,这类技术有望真正融入临床工作流程,提升肾脏疾病的诊断效率和准确性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号