编辑推荐:
本文聚焦 p16+口咽鳞状细胞癌(p16+OPSCC),开发并验证基于 CT 的深度学习模型。该模型整合原发肿瘤(PT)和转移颈部淋巴结(LN)特征,可预测生存结局、化疗获益,有助于优化 p16+OPSCC 治疗方案。
一、研究背景
p16+口咽鳞状细胞癌(p16+OPSCC)发病率上升,年轻幸存者增多,治疗后生活质量备受关注。多数 p16+OPSCC 肿瘤进展较慢,部分患者或可从降低治疗强度中获益,但盲目降低强度可能有害。化疗对低复发风险患者可能带来更高毒副作用,因此需要精准识别低风险患者,以优化治疗策略,减少毒副作用,同时维持生存结局。
目前,TNM 分期虽能评估 p16+OPSCC 风险,但在量化肿瘤内和淋巴结内异质性方面存在局限。放射学计算机断层扫描(CT)常用于 p16+OPSCC 的预后评估和治疗反应评估,原发肿瘤(PT)与转移颈部淋巴结(LN)的独特生物学特征及相互作用会产生独特成像表型,借助深度学习算法分析这些表型,有望预测临床结局。不过,此前对 PT 和颈部 LN 联合人工智能评估的研究较少。
二、研究方法
- 研究设计与数据来源:本研究为回顾性分析,纳入 811 例 p16+OPSCC 患者,数据来自癌症影像存档库(TCIA,n = 522,1998 - 2013 年)、克利夫兰诊所基金会(CCF,n = 233)和温希普癌症研究所(Winship,n = 56,2002 - 2015 年)。将 TCIA 中 452 例患者随机分为训练集(D1),70 例为内部验证集(D2),CCF 和 Winship 患者组成外部测试集(D3) 。所有患者均接受根治性放疗或同步放化疗。
- CT 图像预处理:患者治疗前进行 CT 扫描,部分注射对比剂。使用 3D Slicer 软件手动分割图像,排除有牙科伪影的切片。
- 深度学习模型构建:采用分层视觉 Transformer 架构,用 4 个分层视觉 Transformer 块分别从 PT 和转移 LN 中提取特征,利用自注意力机制增强两者信息交互。以 3 年无病生存期(DFS)为目标,通过二元交叉熵损失监督学习过程,输出多区域成像风险评分(SwinScore)。
- 统计分析:运用多种统计方法,包括 1 - 方差分析、χ2检验、Harrell 一致性指数(C 指数)、Kaplan - Meier 曲线、对数秩检验、Cox 比例风险回归模型等。计算 Shapley 可加解释值(SHAP)评估变量重要性,绘制校准曲线和决策曲线进行模型评估,通过交互检验探究多区域成像风险评分与化疗获益的关系 。
三、研究结果
- 患者特征:811 例患者中,男性 683 例(84.2%),女性 128 例(15.8%),中位年龄 59.0 岁。各分期患者数量不同,部分接受单纯根治性放疗,部分接受同步放化疗。随访期间,DFS、总生存期(OS)和局部区域失败(LRF)的事件数及中位随访时间各异。
- 多区域成像风险评分的预后价值:在外部测试集 D3 中,多区域成像风险评分对 DFS、OS 和 LRF 均有预后价值,C 指数达 0.63,高于仅关注 PT(0.61)或 LN(0.58)的模型。在不同分期亚组分析中,该评分在 I 期和 III 期疾病中对 DFS、OS 和 LRF 有显著分层作用,但在 II 期疾病中,仅对 DFS 和 OS 的风险分层有一定意义 。多变量 Cox 比例风险回归证实其为 DFS 和 OS 的独立预后因素,SHAP 值显示其在模型中最为重要。
- PT 和转移 LN 的预后价值:分别输入 PT 或 LN 数据得到相应风险评分 SwinPT 和 SwinLN,多区域成像风险评分在预测 DFS 和 OS 方面 C 指数最高,但在 LRF 预测上不如 SwinPT。决策曲线分析表明,多区域成像风险评分在预测 DFS 和 OS 方面优于 SwinPT、SwinLN 和临床模型,在 LRF 预测上与 SwinPT 净获益相当 。整合梯度注意力图显示,该评分与 PT 和转移颈部 LN 区域对应良好。相关性分析和基因集富集揭示了其与免疫相关通路和基因集的联系。
- 多区域成像风险评分与化疗获益的关系:针对 I 期和 II 期肿瘤患者分析,高多区域成像风险评分患者接受同步放化疗的 3 年 DFS 死亡或失败率显著低于单纯放疗,低评分患者两种治疗方式差异不明显。高评分患者接受化疗有显著 DFS 获益,低评分患者则无。交互检验证实了多区域成像风险评分与化疗存在显著交互作用 。
四、讨论
p16+OPSCC 患者总体预后较好,但临床行为多变,易出现过度或治疗不足。本研究开发的多区域成像风险评分,整合 PT 和转移颈部 LN 空间数据,可显著分层患者风险,是 OS 和 DFS 的独立预后标志物。在 I 期疾病患者中,其与预后关联紧密,若经前瞻性临床试验验证,有望影响临床实践,识别高风险患者,优化低风险患者治疗 。
本研究独特之处在于利用深度学习、自注意力机制和 Kronecker 积自动量化转移颈部 LN 成像模式及其与 PT 的相互作用,相较于传统方法,能更好捕捉区域间相互作用。研究还发现转移 LN 在 DFS 和 OS 预测中有重要价值,但与 LRF 关联较弱 。
不过,本研究存在局限性。深度学习方法可解释性较弱;仅分析最大转移 LN,可能未充分挖掘 LN 预后价值;研究为回顾性,易受混杂因素影响,且 TCIA 数据缺乏放化疗详细信息,其评分的预后和预测性能在统一治疗方案中的普适性有待验证 。
五、结论
本研究开发并验证了多区域成像风险评分这一预后和预测生物标志物,可基于常规 CT 扫描挖掘 PT 和转移颈部 LN 特征,对 p16+OPSCC 进行风险分层。在 AJCC 第 8 版分期的 I 期肿瘤中,该评分还能预测化疗获益,有助于优化 p16+OPSCC 治疗方案,推动个性化治疗策略发展,但仍需进一步在回顾性和前瞻性临床试验中验证 。