编辑推荐:
为解决全玻片图像(WSIs)标注耗力、现有 MIL 方法易忽略语义特征问题,研究人员提出 Cluster-Aware Attention-based MIL(CAAMIL)架构。实验显示,其 slide-level 肿瘤检测 AUC 达 0.96,patch-level 达 0.85,为病理诊断提供新工具。
在医学病理诊断的微观世界里,组织病理学图像如同承载着疾病密码的 “生命地图”。病理医生需通过观察细胞形态、组织结构的细微变化来判断病变性质,但全玻片图像(WSIs)因其超高分辨率和庞大的数据量,带来了标注难题 —— 专家需逐片标记异常区域,耗时耗力且受组织异质性、染色差异等因素干扰,难以保证一致性。传统的多实例学习(MIL)方法虽能利用玻片级标注进行弱监督学习,但注意力机制往往聚焦高肿瘤密度区域,容易忽略潜在的语义特征,导致对异质性特征的识别能力有限。如何让算法更精准地捕捉复杂病理特征,同时兼具可解释性,成为困扰领域的关键问题。
为突破这一瓶颈,来自相关研究机构的研究人员开展了一项具有创新性的研究。他们提出了一种基于聚类注意力的多实例学习网络(Cluster-Aware Attention-based MIL,CAAMIL),旨在通过整合注意力机制与聚类方法,提升组织病理学图像解读的准确性和可解释性。这项研究成果发表在《Computers in Biology and Medicine》上,为病理诊断的智能化发展提供了新方向。
研究人员主要采用了以下关键技术方法:首先对 WSIs 进行下采样处理,使用 Lanczos 插值将图像下采样至 level 3,得到 8 倍缩小的图像后,将其分割为 256×256 像素的非重叠补丁。模型架构中引入了聚类注意力模块,与实例注意力模块结合,通过对 architectural(结构)或 cytologic(细胞)特征进行聚类,使特征组在聚类层面具有可解释性,同时稳定特征表示,缓解实例级注意力的波动。实验使用了包含肿瘤标注的 TERT25 数据集等,在玻片级和补丁级分类任务中验证模型性能。
结果
肿瘤检测与突变预测性能
研究通过玻片级目标标签评估模型的肿瘤检测能力,并尝试预测 TERT 启动子突变状态。结果显示,CAAMIL 在玻片级肿瘤检测中取得了 0.96 的 AUC 分数,在补丁级分类中 AUC 为 0.85,显著优于其他基于 MIL 的先进方法,表明其在不同层级的病理图像分类中均具有优越性能。
特征聚类与可解释性分析
模型通过聚类注意力分数提供了较强的可解释性,聚类结果与人类专家标注高度吻合,能够反映组织病理学分级或预后指标。例如,突出显示的特征组可被解读为特定的病理等级,揭示了与分类决策相关的形态学特征,为病理机制分析提供了直观依据。
讨论与结论
CAAMIL 架构通过有效聚类特征并提供可解释结果,克服了现有 MIL 方法的局限性。其创新点在于将聚类思想融入注意力机制,不仅提升了模型对异质特征的捕捉能力,还通过聚类层面的解释性,架起了算法与病理专家之间的理解桥梁。实验结果表明,该模型在肿瘤检测和突变预测中表现出色,为高效处理大规模 WSIs 数据提供了新范式,有望成为辅助病理诊断、加速癌症研究的重要工具。
这项研究不仅在技术上实现了对传统 MIL 方法的突破,更在实际应用层面展现了人工智能与病理诊断结合的潜力。通过 CAAMIL,病理医生有望从繁琐的标注工作中解放出来,将更多精力投入到复杂病例的分析中,推动精准医疗的发展。未来,随着算法的进一步优化和更多临床数据的验证,此类模型或将成为病理科不可或缺的 “智能助手”,开启数字病理诊断的新篇章。