编辑推荐:
本文介绍了 MMRNet,这一深度学习模型可从苏木精 - 伊红(H&E)染色的全切片图像预测子宫内膜癌(EC)的错配修复(MMR)缺陷状态。其在多数据集表现良好,人机融合策略还能提升诊断准确性,为 EC 诊疗提供了新方向。
研究背景
子宫内膜癌(EC)是全球第三大常见妇科癌症,发病率逐年上升。通过分子分类与临床病理方法相结合,能改善 EC 的风险评估和治疗选择。癌症基因组图谱(TCGA)将 EC 分为四种分子亚型,其中错配修复缺陷型(MMRD)的 EC 患者约占 20%-30%,对免疫检查点抑制剂治疗反应良好。目前检测 MMR 缺陷的方法,如基于微卫星不稳定性(MSI)的聚合酶链反应(PCR)、下一代测序(NGS)和免疫组织化学(IHC)等,存在资源消耗大、时间长、成本高等问题,限制了其广泛应用。因此,开发一种经济有效的工具来检测 EC 患者的 MMR 状态迫在眉睫。深度学习模型在从 H&E 染色的全切片图像(WSIs)中检测癌症亚型和分子特征方面展现出潜力,本研究旨在开发并验证 MMRNet,以利用 H&E 染色切片预测 EC 患者的 MMR 状态。
研究方法
- 患者队列:利用四个不同的队列来评估 MMRNet 的有效性。内部子宫体子宫内膜癌(Internal-UCEC)数据集用于模型开发,包含 242 例 MMR 缺陷型子宫内膜癌(MMRDEC)患者和 784 例 MMR proficient 型子宫内膜癌(MMRPEC)患者的 H&E 染色 WSIs。此外,还使用了三个独立的外部验证数据集:TCGA-UCEC、MultiCenter-UCEC 和 GWCH-UCEC,这些数据集涵盖了不同中心的患者,具有广泛的代表性。
- MMRNet 的开发与评估:MMRNet 是一个基于多种网络骨干(如 EfficientNet 和 ResNet18)的集成二元分类器。通过 5 折交叉验证策略训练模型,将数据集在幻灯片层面分为五部分,每个分类器使用其中四部分进行训练,剩余部分作为内部验证集确定最佳训练停止点。为减少肿瘤大小带来的偏差,将大的 WSIs 在 10 倍放大倍数下分割成不重叠的小块,进行颜色归一化和大小调整后输入模型,通过简单平均聚合补丁级预测得到幻灯片级结果。
- 评估指标:通过计算受试者工作特征曲线下面积(AUROC)、灵敏度、特异性和阴性预测值(NPV)等指标来评估 MMRNet 的诊断性能。同时,进行健康经济学评估,比较 MMRNet 与传统诊断方法在时间、成本、人力和设备要求等方面的差异。此外,分析 MMRNet 预测结果与组织病理学特征之间的相关性,并对 MMRNet 的误诊情况进行深入分析。
研究结果
- MMRNet 的诊断性能:在内部数据集的内部交叉验证中,MMRNet 的 AUROC 平均为 0.897,灵敏度为 0.628,特异性为 0.949。在外部验证中,使用 TCGA-UCEC、MultiCenter-UCEC 和 GWCH-UCEC 数据集,MMRNet 的 AUROC 分别为 0.790、0.807 和 0.863。健康经济学评估显示,MMRNet 在效率和成本方面优于传统诊断方法,如 IHC、PCR 和 NGS。
- 与病理学家的比较:通过读者研究比较 MMRNet 与不同经验水平病理学家的诊断性能。结果表明,MMRNet 的 AUROC 显著超过初级和高级病理学家,与专家病理学家的表现接近。在所有三个外部数据集中,MMRNet 的灵敏度均优于所有病理学家,这表明其在筛查潜在 MMR 缺陷病例方面具有重要价值。
- 人机融合策略:开发人机融合策略,将 MMRNet 的预测结果与不同经验水平病理学家的评估相结合。在各个外部数据集上,人机融合策略均提高了诊断准确性,其 AUROC 超过了 MMRNet 单独预测的结果。这表明人机融合方法能够有效提升对 EC 患者 MMR 状态的预测能力。
- 组织病理学特征与 MMRNet 预测的相关性:通过逻辑回归模型分析发现,在不同数据集中,MMRNet 对 MMRDEC 的预测与多种组织病理学特征相关,如肿瘤浸润淋巴细胞(TILs)、肿瘤周围淋巴细胞、实性圆形至椭圆形细胞片、淋巴上皮瘤样形态和背景子宫内膜增生等。通过在 WSIs 上叠加热图,可直观地观察到 MMRNet 关注的区域,进一步验证了这些特征在模型预测中的重要性。
- MMRNet 的误诊分析:对 MMRNet 在不同数据集上的误诊情况进行分析,发现不同数据集中误诊病例的形态学特征存在差异。例如,在 TCGA-UCEC 数据集中,假阳性病例中 TILs 显著存在;在 MultiCenter-UCEC 数据集中,假阳性病例表现为乳头状 / 息肉样和黏液样分化,假阴性病例缺乏实性圆形至椭圆形细胞片;在 GWCH-UCEC 数据集中,假阳性病例有显著的肿瘤周围淋巴细胞和实性圆形至椭圆形细胞片,假阴性病例缺乏以子宫下段(LUS)为中心的特征。同时,对比了人类病理学家和 MMRNet 模型的误诊情况,发现 MMRNet 受某些复杂组织病理学特征的影响较小,能够更准确地进行分类。
研究讨论
- MMRNet 的优势:MMRNet 在不同临床环境和机构中表现优于病理学家,且通过人机融合可进一步提高其识别 MMRDEC 亚型的能力,有望作为选择适合免疫治疗的 EC 患者的生物标志物。与以往研究中仅在特定队列或单一数据集上验证的模型不同,MMRNet 在内部数据集和三个外部数据集上进行了广泛验证,涵盖了多种 EC 阶段和不同中心的患者,增强了模型的临床相关性和通用性。此外,MMRNet 使用了更浅的 ResNet18 架构,减少了参数数量,降低了计算需求,更适合大规模病理切片处理,在资源受限的环境中也具有应用潜力。
- MMRNet 的局限性:尽管 MMRNet 取得了较好的结果,但研究仍存在局限性。首先,MMRNet 的训练是回顾性的,需要前瞻性临床验证。其次,人机融合方法虽然对初级病理学家有较大帮助,但仍需进一步优化以提高其临床实用性。再者,MMRNet 虽然能准确识别 MSI 状态,但不能替代分子分类,且回顾性数据集限制了全面的分子特征分析,未来需要与分子谱分析相结合。另外,对于 Lynch 综合征相关病例,由于数据集较小,限制了相关结论的得出,需要更大规模的研究来评估 MMRNet 与 NGS 相比的准确性。最后,不同数据集之间灵敏度和特异性的差异,受样本异质性和数据质量的影响,给实际应用带来挑战。
- 研究展望:未来的研究应聚焦于整合临床和组织病理学数据、多模态学习以及采用先进的深度学习架构,以提高模型的准确性和稳定性。同时,进一步探索人机融合在诊断中的应用,有望为病理学家提供更有效的决策支持工具,最终提高 EC 患者的诊断和治疗水平。
综上所述,本研究开发的 MMRNet 为预测 EC 患者的 MMR 状态提供了一种有效的方法,人机融合策略进一步提升了其性能,在 EC 的诊疗中具有潜在的应用价值,但仍需进一步研究和优化以实现临床转化。