多分辨率病理模型:AI驱动的口腔鳞状细胞癌进展预测新方法

《npj Digital Medicine》:AI-driven prediction of progression to oral squamous cell carcinoma using a multiresolution pathology model

【字体: 时间:2025年11月15日 来源:npj Digital Medicine 15.1

编辑推荐:

  【编辑推荐】针对WHO口腔上皮异型增生分级系统主观性强、预测精度有限的问题,研究人员开发了基于视觉转换器(ViT)的多分辨率深度学习模型。该模型通过对221张全切片图像(WSI)的分析,实现了80.0%的准确率和0.798的AUROC,显著优于传统CNN模型。研究首次证实ViT架构在捕捉与恶性转化相关的组织学特征(如异常角化、细胞凋亡等)方面的优势,为口腔潜在恶性病变的风险分层提供了可靠的AI辅助工具。

  
口腔癌是全球范围内常见的恶性肿瘤之一,其发展往往经历从潜在恶性病变(如白斑、红斑等)向浸润性癌转化的多阶段过程。目前临床实践中,世界卫生组织(WHO)推荐的三级异型增生分级系统(轻度、中度、重度)是评估恶性风险的主要依据。然而,这一系统存在明显局限性:不同病理医生之间的诊断一致性较低(Kappa值仅0.41-0.5),且无法准确区分真正的高风险病变。研究表明,约20-35%的重度异型增生和5-15%的轻中度病变会最终发展为癌症,这意味着现有方法可能错过大量需要积极干预的患者。
为了突破这一临床困境,研究团队将目光投向人工智能技术。随着数字病理的普及,全切片图像(WSI)为开发新型辅助诊断工具提供了契机。尽管基于卷积神经网络(CNN)的模型在疾病检测方面已取得显著进展,但其在预测恶性转化方面的表现仍不理想(AUROC仅0.68-0.77)。这主要是因为CNN架构更擅长捕捉局部特征,而难以识别与恶性进展相关的长距离组织学模式。
在此背景下,由Yingci Liu-Swetz领衔的研究团队在《npj Digital Medicine》上发表了一项创新性研究,他们开发了一种基于视觉转换器(ViT)的多分辨率深度学习模型,能够准确预测口腔潜在恶性病变向鳞状细胞癌的转化风险。该研究的独特之处在于首次将多分辨率分析与ViT架构相结合,模拟病理医生在诊断过程中调整放大倍数的常规做法,从而同时捕获组织架构的整体信息和细胞核的细微特征。
研究团队采用回顾性队列设计,收集了来自多个机构的221例患者样本(111例进展者,110例非进展者)。所有病例均经组织学确诊为口腔上皮异型增生,并具有至少5年的随访数据。进展者定义为初次活检后6个月以上发展为口腔鳞状细胞癌的患者,而非进展者则在5年内未出现恶性转化。
关键技术方法包括:使用Aperio AT2扫描仪将病理切片数字化为WSI;通过OpenSlide库进行多分辨率patch提取(10x、20x、40x);构建基于DINOv2的ViT模型,并与传统CNN架构(VGG16、InceptionV3、ResNet50)进行性能对比;采用5折交叉验证评估模型稳定性;通过决策曲线分析(DCA)评估临床效用;由三位病理医生独立评估24种组织病理学特征以验证模型可解释性。
分类性能随多分辨率分析提升
通过消融实验评估不同分辨率组合对模型性能的影响。结果显示,随着分辨率 backbone 数量的增加,所有关键指标均呈现稳定上升趋势。单一分辨率(20x)模型的准确率为0.676,而结合10x、20x、40x的三分辨率模型将准确率提升至0.711,F1分数从0.697提高至0.732。这表明多分辨率分析能显著增强模型捕获不同尺度病理特征的能力,正如病理医生在诊断时需要交替使用低倍镜观察组织架构和高倍镜分析细胞细节。
视觉转换器模型优于CNN
在架构对比中,ViT(DINOv2)模型在所有指标上均显著超越传统CNN模型。ViT模型的平均准确率达到0.670±0.014,而表现最佳的CNN模型(VGG16)仅为0.557。特别值得注意的是,ViT在特异性指标上表现突出(0.620±0.014 vs CNN的0.327-0.442),说明其更擅长识别真正的低风险病变。这一优势归因于ViT的self-attention机制能够捕捉图像中远距离区域间的关联,而CNN的局部感受野限制了对组织架构整体模式的识别。
测试数据中恶性进展的预测
在50例独立测试集上,最佳表现的ViT模型达到80.0%的准确率和0.773的F1分数,AUROC为0.798。与WHO分级系统相比,模型的阳性预测值(PPV)显著更高(0.739 vs 0.543)。当与三位病理医生的二元分类(高风险/低风险)对比时,ViT模型在敏感性(0.810 vs 0.762)和精确度方面均表现更优。决策曲线分析显示,在0.05-0.75的阈值范围内,该模型比"全部治疗"或"全部观察"策略具有更显著的临床净收益。
模型预测与WHO组织病理学特征的相关性
通过分析24种已知的异型增生特征,研究发现AI预测与病理医生评估高度一致。进展者病例中,8种特征的出现频率显著更高(p<0.01),其中核碎裂/凋亡细胞、单细胞角化、异常角化和基底层增生四种特征与恶性进展的关联尤为强烈(p<0.0001)。AI模型判定的进展者的平均异型增生评分显著高于非进展者(2.17 vs 1.24,p<0.001),表明模型预测与组织学严重程度密切相关。
讨论部分强调,这项研究代表了计算病理学在预后预测领域的重要进展。与既往主要关注疾病检测的研究不同,该模型在更具挑战性的恶性转化预测任务中表现出色。多分辨率ViT框架的创新之处在于其能够模拟人类诊断模式,动态整合从宏观组织架构到微观细胞特征的多尺度信息。
值得注意的是,模型预测与经典组织学标志物高度一致,说明其决策基于可靠的病理生物学基础,而非黑箱操作。特别是模型识别出的关键特征(如异常角化、凋亡增加等)与已知的恶性转化标志相符,增强了结果的可信度。
研究的临床意义在于提供了一种客观、可重复的风险评估工具,有望解决当前异型增生分级的主观性问题。对于被归类为高风险的患者,可建议更积极的干预(如手术切除),而低风险患者则可避免过度治疗。这种精准分层有望优化医疗资源分配,同时减少患者不必要的焦虑和侵入性 procedures。
然而,作者也指出研究的局限性,包括样本量相对有限、未纳入临床变量(如吸烟、饮酒等),以及需要前瞻性验证。未来工作应聚焦于多中心合作扩大数据集,并探索整合临床与影像数据的多模态AI框架。
总之,这项研究开发了一种创新的多分辨率ViT模型,能够直接基于WSI预测口腔上皮病变的恶性转化风险。模型性能超越传统病理分级,且与组织学严重程度显著相关,显示出巨大的临床转化潜力。随着数字病理的普及,这种AI工具有望成为病理医生的有力辅助,提高口腔癌早期诊断的准确性,最终改善患者预后。该框架还可适配于其他疾病的计算病理学分析,推动精准医疗的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号