《npj Digital Medicine》:GlioSurv: interpretable transformer for multimodal, individualized survival prediction in diffuse glioma
编辑推荐:
弥漫性胶质瘤生存预测长期受限于数据碎片化与模型黑箱。本研究以AFT框架融合MRI-临床-分子-治疗信息,构建可解释Transformer模型GlioSurv,在四中心1944例患者中实现C-index 0.80、IAUC 0.86,显著优于CNN、ViT及无影像模型,为IDH、MGMTp等关键亚组提供个体化生存曲线,助力神经肿瘤风险分层与临床决策。
成人型弥漫性胶质瘤是中枢神经系统最常见的原发恶性肿瘤,分子异质性导致同样接受手术+放化疗的患者,生存期却从数月到十余年不等。2021年WHO分类虽将肿瘤按IDH突变及1p/19q共缺失划分为少突胶质细胞瘤、星形细胞瘤和IDH野生型胶质母细胞瘤,但临床仍依赖年龄、Karnofsky体能状态(KPS)等经验指标估预后,误差大且无法量化个体化不确定性。更棘手的是,既往深度学习模型要么只读MRI遗漏治疗信息,要么简单拼接多组学数据,遇到缺失字段便性能骤降,还把生存时间粗暴划成“高-中-低”三档,难以回答“这位患者12个月内存活概率是多少”这一临床灵魂拷问。
为破解上述困境,Junhyeok Lee与首尔国立大学医院Kyu Sung Choi团队提出GlioSurv——首个基于加速失效时间(AFT)框架的多模态Transformer。研究回顾性整合4个独立中心共1944例成人型弥漫性胶质瘤,内部队列(n=891)用于训练,外部机构(n=84)、UCSF(n=470)及UPenn(n=499)用于验证。模型依次输入多参数MRI、临床-分子变量及手术/放化疗信息,通过“生存查询令牌”跨模态注意力融合,直接输出个体化Weibull生存曲线。结果显示:GlioSurv内部验证C-index达0.80[0.76-0.84],IAUC 0.86[0.82-0.91],IBS仅0.10[0.08-0.12];在外部胶质母细胞瘤队列仍保持C-index 0.61-0.71,显著优于CNN、ViT及无影像模型(NIMT)。增量分析表明,相对仅用MRI+人口学基线,逐步加入KPS、遗传学(IDH、1p/19q、MGMTp)及治疗变量,C-index由0.69升至0.80,IAUC由0.71增至0.86,证实治疗信息对校准曲线至关重要。Eigen-CAM激活图显示模型关注增强瘤核与瘤周水肿,与组织学高危区吻合;SHAP归因揭示IDH野生型、MGMTp未甲基化及高龄为风险升高的Top3因子,符合经典生存认知。Kaplan-Meier风险分层提示,GlioSurv划定的低/高危组12个月生存概率差异达26-40%,且决策曲线在0.1-0.6阈值区间均优于“全治”或“全不治”策略,提示可减少无效治疗。作者指出,GlioSurv以 masked cross-attention天然处理缺失字段,AFT头直接估计个体生存分布,兼具准确性与可解释性,未来可嵌入随访影像时序数据,实现动态预后更新。论文2025年发表于《npj Digital Medicine》。
关键技术速览:1) 多参数MRI(含T1、T1C、T2、FLAIR)经Vision Transformer编码;2) 临床、分子及治疗信息转化为自然语言提示,用BERT嵌入;3) 三模态表征经交叉注意力融合,可学习“生存查询令牌”参数化Weibull AFT模型;4) 采用两阶段训练:先内部MRI预训练,再冻结权重联合调优AFT头;5) Eigen-CAM、Grad-CAM与SHAP联合解释空间与特征贡献。
研究结果
队列特征
四中心1944例患者分子-临床特征差异显著,内部队列更年轻、OS更长(32.2月),外部UCSF最短(18.8月),为模型泛化提供严苛考验。
模型性能
GlioSurv在所有验证集均显著优于CNN、ViT及NIMT,IAUC提升0.07-0.18,IBS降低0.05-0.14,C-index最高提升0.17,且时间依赖性曲线在36个月内保持稳定校准。
风险分层
以中位风险切点分高/低危,GlioSurv四队列log-rank P<0.001,12个月生存概率差达26-40%,而ViT在部分外部集失去显著性,凸显多模态优势。
亚组分析
模型在MGMTp甲基化、KPS≥80及年轻(≤47岁)患者中表现更优,C-index可升至0.83;对IDH野生型胶质母细胞瘤仍具区分度,提示对最坏预后亚组亦能提供信息。
增量信息整合
逐步加入KPS、遗传学及治疗变量,C-index由0.69→0.71→0.77→0.80,IAUC由0.71→0.86,证实每类信息均独立提升精度,且治疗数据对校准误差降幅最大(ECE 0.096→0.058)。
个体可解释性
Eigen-CAM高激活区与肿瘤增强区及FLAIR高信号重叠率73-94%,SHAP显示组织学、MGMTp及年龄贡献度最高,可生成带95%置信区间的个人生存曲线,方便与患者沟通。
结论与讨论
GlioSurv首次将AFT框架引入多模态Transformer,实现弥漫性胶质瘤个体化、连续型生存预测,克服传统模型“黑箱+分类输出”弊端。其跨中心稳健性能说明对缺失数据的自适应处理有效,决策曲线进一步证实临床净获益。未来整合功能MRI、术后纵向影像及复发模式,有望推动神经肿瘤进入“动态数字预后”时代。