编辑推荐:
宫颈癌严重威胁女性健康,为探究 HPV 阳性宫颈鳞状细胞癌(CSCC)分子亚型与组织学关系,研究人员开展相关研究。结果显示,Digital-CMS 评分可分层患者,还揭示了肿瘤微环境差异。该研究为临床提供新方法和视角,意义重大。
宫颈癌,作为全球女性中发病率和死亡率均位列第四的恶性肿瘤,如同隐藏在女性健康道路上的 “暗礁”,时刻威胁着女性的生命健康。高危型人乳头瘤病毒(HPV)感染是宫颈癌的主要诱因,几乎所有宫颈癌病例都与之相关。HPV 的致癌机制在于其产生的癌蛋白 E6 和 E7,它们如同 “破坏分子”,通过使肿瘤抑制蛋白 p53 和视网膜母细胞瘤蛋白(pRb)失活,肆意扰乱正常细胞的生命周期,进而导致细胞不受控制地增殖、异常存活,最终引发基因组不稳定。在宫颈癌众多类型中,宫颈鳞状细胞癌(CSCC)最为常见,占比超过 80% 。
尽管在发达国家,预防性 HPV 疫苗的接种和筛查项目显著降低了宫颈癌的发病率,但在发展中国家,由于预防措施和医疗服务的可及性受限,宫颈癌依然是女性健康的 “头号杀手”。目前,临床分期是影响患者生存的关键因素,也是决定治疗方案的重要依据。然而,现有的治疗手段,包括手术、化疗、放疗及其联合疗法,都是依据癌症分期、复发情况和患者个体因素来选择,治疗方案的精准性仍有待提高。而且,虽然免疫疗法已获批用于治疗晚期、复发或转移性宫颈癌,但 HPV 阳性 CSCC 具有高度异质性,现有治疗方案难以满足所有患者的需求。
在这样的背景下,来自英国华威大学、挪威奥斯陆大学医院等机构的研究人员开展了一项重要研究,相关成果发表在《npj Precision Oncology》杂志上。该研究旨在通过深度学习算法,从常规苏木精 - 伊红(H&E)染色的组织学切片数字化图像中预测 HPV 阳性 CSCC 患者的共识分子亚型(CMS),为宫颈癌的精准诊疗提供新的方向和方法。
研究人员运用了多种关键技术方法来开展此项研究。在数据收集方面,使用了来自美国 27 个医疗中心的 203 例 TCGA-CESC 队列、乌干达癌症研究所的 94 例 Uganda-CSCC 队列以及挪威奥斯陆大学医院的 248 例 Oslo-CSCC 队列。通过特定工具对全切片图像(WSIs)进行预处理,提取图像特征。采用基于多实例学习(MIL)的 TripletMIL 框架进行 CMS 状态预测,并使用了 UNI 这一特定的基础模型来提取特征表示。同时,运用生存分析、细胞检测和分类等技术对肿瘤微环境进行分析。
CMS 预测和 TME 分析流程
研究人员提出了一个深度学习框架,用于从 H&E 染色的组织学 WSIs 中预测基因组确定的 CMS。首先从 WSIs 中提取图像块,利用领域特定的基础模型提取特征表示,再用已有的基因组确定的 CMS 训练 TripletMIL 模型,从而实现对 CMS 状态的预测,并生成 Digital-CMS 评分用于患者分层。通过对代表性 WSI 图像块进行聚类,识别与 CMS 状态相关的视觉模式。运用细胞检测和分类模型,对代表性组织区域中的不同细胞类型进行识别,并提取细胞组成和形态特征,以进行全面的肿瘤微环境(TME)分析。
从 H&E 染色的 WSIs 中预测 CMS
研究人员设计了三种跨队列设置,使用来自不同大洲的三个队列进行分析,以评估框架的稳健性和泛化能力。在不同的跨队列设置中,TripletMIL 模型在不同队列上均取得了较好的预测效果,如在 TCGA-CESC 队列上的 AUC 达到 0.78 ± 0.03,在 Oslo-CSCC 队列上的 AUC 达到 0.85 ± 0.04,在 Uganda-CSCC 队列上的 AUC 达到 0.85 ± 0.02。这表明该模型能够从常规 H&E 组织学图像中有效预测 CMS。
Digital-CMS 评分与预后的关系
实验表明,Digital-CMS 评分在 TCGA-CESC 和 Oslo-CSCC 队列的疾病特异性生存(DSS)和无病生存(DFS)方面,都能实现具有统计学意义的分层。在 TCGA-CESC 队列中,低风险组(预测为 C1)和高风险组(预测为 C2)在 DSS(p = 0.0022)和 DFS(p = 0.0495)上存在显著差异;在 Oslo-CSCC 队列中,同样在 DSS(p = 0.0495)和 DFS(p = 0.0282)上差异显著。多变量分析显示,在 TCGA-CESC 队列中,Digital-CMS C2 是 DFS(p = 0.04)和 DSS(p = 0.02)的独立预测因子;在 Oslo-CSCC 队列中,Digital-CMS C2 对 DSS 有一定预测意义(p = 0.05)。
队列中与 CMS 相关的组织学特征
通过分析与 CMS 状态相关的组织区域,研究人员发现 C1 和 C2 肿瘤在组织学特征上存在明显差异。C1 区域细胞密度较高,细胞形状更规则;C2 区域细胞具有更高的核多形性,核增大。对 TME 模式的定量分析显示,C1 区域的肿瘤和上皮细胞密度较高,而 C2 区域的肿瘤和上皮细胞更大且更不规则,C2 区域的结缔细胞大小也更不规则。
队列中与 CMS 相关的免疫模式
在免疫模式方面,C2 区域的中性粒细胞与淋巴细胞比值(NLR)、中性粒细胞密度和比值均升高,嗜酸性粒细胞比值也升高;C1 区域的淋巴细胞密度较高,且淋巴细胞尺寸更大。在患者层面的分析也显示出类似趋势,并且发现 Digital-CMS 评分与 CD8+评分呈负相关,表明 C2 患者的 CD8+评分较低。
C1 肿瘤中更高的淋巴细胞浸润
肿瘤浸润淋巴细胞(TILs)是癌症的重要生物标志物,与临床结果和免疫治疗疗效相关。研究发现,C1 肿瘤在肿瘤丰富区域的淋巴细胞密度高于 C2 肿瘤,且 Digital-CMS 评分与淋巴细胞密度呈负相关。不过,TCGA-CESC 和 Oslo-CSCC 队列之间的相关性较弱,说明淋巴细胞浸润只是影响预后差异的因素之一。
研究结论表明,该深度学习框架能够从 H&E 染色组织学切片中有效预测 HPV 阳性 CSCC 患者的 CMS 状态,Digital-CMS 评分在患者分层和预后评估方面具有重要价值。通过对肿瘤微环境的分析,揭示了 C1 和 C2 肿瘤在组织学和免疫特征上的差异,这些差异为理解肿瘤的发生发展和预后提供了新的视角。同时,研究发现的与 CMS 相关的组织学和免疫特征,可作为潜在的视觉标记,为病理学家进行患者预后评估提供帮助。然而,该研究也存在一定局限性,如算法在 TCGA-CESC 队列上的预测准确性有待提高,Digital-CMS 评分可能导致患者分层偏差,且研究队列可能无法代表中低收入国家的患者情况。未来需要进一步开展大规模验证研究,优化模型,以提高其在不同人群中的适用性和准确性。总体而言,这项研究为宫颈癌的精准诊疗提供了新的思路和方法,有望推动该领域的发展,改善患者的预后。