自监督人工智能精准预判原发性皮肤鳞状细胞癌预后,开辟临床决策新路径

【字体: 时间:2025年02月17日 来源:npj Digital Medicine 12.4

编辑推荐:

  为解决 cSCC 患者不良预后预测难题,纽约大学医学院的研究人员开展自监督人工智能预测 cSCC 预后的研究。结果显示模型预测效果良好。该研究为临床决策提供新依据,极具科研与临床价值,推荐阅读。

  
纽约大学医学院应用生物信息学实验室(Applied Bioinformatics Laboratories, New York University School of Medicine)的 Nicolas Coudray 等人在《npj Digital Medicine》期刊上发表了题为 “Self supervised artificial intelligence predicts poor outcome from primary cutaneous squamous cell carcinoma at diagnosis” 的论文。这篇论文在皮肤鳞状细胞癌(cutaneous squamous cell carcinoma,cSCC)的研究领域意义重大,为早期精准预测患者预后、优化临床决策提供了新的思路和方法。

研究背景


cSCC 是人类第二常见的癌症,在美国每年约有 1 万人因它死亡,全球发病率在过去 20 年呈上升趋势。虽然大多数 cSCC 患者预后良好,但仍有一部分患者会出现不良预后(poor outcomes,PO),包括局部复发(local recurrence,LR)、淋巴结转移(nodal metastasis,NM)、远处转移(distant metastasis,DM)和疾病特异性死亡(disease-specific death,DSD)。目前,由于缺乏准确评估 cSCC 发病率和患病率的国家癌症登记数据,实际的不良预后情况可能被低估。

现有的 cSCC 分期系统,如美国癌症联合委员会分期手册第 8 版(American Joint Committee on Cancer Staging Manual 8th edition,AJCC 8)和布里格姆妇女医院(Brigham and Women’s Hospital,BWH)分期系统,在预测患者不良预后方面存在局限性。尽管大多数不良预后发生在高分期肿瘤中,但仍有 25% 发生在低分期肿瘤(如 BWH T2a 和 AJCC 8 T2),这凸显了该分期系统中风险分层的困难。基因表达分析虽有预测能力,但成本高且并非所有患者都能使用。而通过视觉检查 cSCC 的组织病理学特征来预测风险,尤其是在低分期肿瘤中的作用,还需要进一步明确。传统的显微镜分析存在抽样误差和阅片者之间的差异,限制了其在判断预后方面的作用。因此,开发一种能够准确预测 cSCC 患者不良预后的方法迫在眉睫。

研究方法


研究人员采用了一种基于自监督学习(self-supervised learning)的组织学表型分析流程(Histological Phenotype Pipeline,HPL)。该流程最初在肺癌研究中开发,能以自监督的方式聚类全切片图像(whole-slide images,WSI)的重要特征,在亚型分类和生存预测方面效果良好,还具有额外的可解释性。

研究人员收集了来自 3 个学术机构的 163 名患者的 WSI 作为开发队列,以及来自另外 2 个机构的 563 名患者的 WSI 作为测试队列。对 WSI 进行切片处理,将其转换为 224×224 像素、像素大小约 0.5μm(相当于 20 倍放大倍数)的小图像,并进行颜色归一化处理。利用这些图像训练自监督的 Barlow-Twins 算法网络,将所有切片投影到训练好的网络中,得到 128 维的切片向量表示。通过 Leiden 算法对向量表示进行聚类,形成组织形态学表型簇(Histomorphological Phenotype Clusters,HPC)。为了避免过拟合,研究人员选择了分辨率 r = 0.75 的 Leiden 聚类配置,将数据集划分为 26 个 HPC。同时,研究人员还使用了监督学习方法进行对比,训练了 Inception v3 网络,通过手动标注选定区域来进行结果预测。

研究结果


  1. 自监督学习突出与预后相关的组织形态学表型:通过 Barlow-Twins 自监督方法和 Leiden 算法聚类,研究人员得到了 26 个 HPC。通过对这些 HPC 与患者预后的关系进行分析,发现不同的 HPC 与良好或不良预后存在关联。在预测无病生存期(disease-free survival,DFS)方面,模型在开发队列中的一致性指数(concordance index)为 0.73,在梅奥诊所(Mayo Clinic)队列中为 0.84。这表明模型能够有效区分高风险和低风险患者。
  2. 自监督学习识别与生存相关的组织形态学表型簇:单变量 c 指数分析显示,一些 HPC 与不良或良好预后相关,其中 10 个 HPC 的趋势在两个外部队列中得到了证实。多变量逻辑回归分析表明,基于 HPC 分布预测二元结果(良好或不良预后)时,在开发数据集上的平均 3 折交叉验证 AUC 为 0.724(验证集)和 0.689(测试集),在梅奥外部队列中表现良好,AUC 约为 0.844。与监督学习方法相比,自监督学习方法表现更优,且无需手动标注,可解释性更强。
  3. 聚类解释突出与风险相关的组织形态学表型:对 HPC 进行详细分析后发现,与高风险 PO 相关的 HPC,如 HPC 6 和 HPC 20,其特征为低分化、有丝分裂以及癌细胞的深浸润。而与低风险 PO 相关的 HPC,如 HPC 3、HPC 8 和 HPC 16,其特征为角质形成细胞分化良好,无明显异型性或多形性。此外,研究还发现同一患者的不同切片之间 HPC 组成具有较高的同质性,且活检类型和解剖部位对生存预测的影响尚不明确,但大多数 HPC 包含来自不同类型活检和解剖部位的切片。

研究结论与讨论


这项研究表明,HPL 的自监督方法可成功应用于分析不同机构的 cSCC 初始活检样本的 WSI,能够将与良好和不良预后相关的多种组织病理学特征进行合理分组。通过该方法识别的 HPC 可用于预测 cSCC 患者的预后,在开发队列和测试队列中都取得了较好的预测性能。特别是在 AJCC-8 T2 和 BWH T2a 低分期肿瘤中,该方法能够有效区分患者的 PO 风险,填补了现有文献在这方面的空白。

研究发现,富含 HPC 3 和 HPC 8 的样本与良好预后相关,而富含 HPC 7 和 HPC 16 的样本也在一定程度上与较低的 PO 风险相关。与高 PO 风险相关的主要表型是严重的多形性、低分化和深浸润,这与先前的研究以及当前的 BWH 和 AJCC-8 分期系统一致。

该研究成果对临床决策具有重要指导意义。通过活检切片获取的预后信息可帮助医生制定治疗方案和监测计划。对于高风险患者,可能需要进行术前成像、更频繁的随访或采用 Mohs 显微外科手术以确保肿瘤完全切除并进行更精确的病理分期。此外,结合现有临床信息和该研究的数据,有望更准确地识别高风险患者,为进一步的影像学检查和后续治疗提供依据。

然而,该研究也存在一定的局限性。数据集的规模相对较小,未来需要开发和获取更大的数据集来进一步验证和扩展当前的研究成果。同时,活检类型和解剖部位对结果的潜在影响还需要更多研究。但总体而言,这项研究为 cSCC 的预后预测和临床管理开辟了新的方向,自监督学习在 cSCC 的预后评估中展现出了巨大的潜力,有望为患者带来更好的治疗效果和生存质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号