基于深度学习的成人弥漫性低级别胶质瘤生存预测模型:多队列验证研究
《Hormones & Cancer》:Deep learning-based survival prediction model for adult diffuse low-grade glioma: a multi-cohort validation study
【字体:
大
中
小
】
时间:2025年10月04日
来源:Hormones & Cancer
编辑推荐:
本研究针对成人弥漫性低级别胶质瘤(DLGG)预后评估复杂难题,开发并验证了一种基于DeepSurv深度学习架构的生存预测模型。研究整合了年龄、IDH突变状态等7个临床病理变量,在包含1079例患者的多队列中验证显示C-index达0.81(训练集)/0.76(内验证)/0.87(外验证),显著提升预后精准度。模型已部署为临床可用网络平台,为DLGG个体化治疗决策提供新工具。
在神经肿瘤领域,成人弥漫性低级别胶质瘤(DLGG)一直被视为临床管理的难点。这类肿瘤虽然病理分级较低,但其生物学行为却呈现出惊人的异质性——有些患者可长期稳定生存,而另一些则会快速进展为高级别胶质瘤。当前临床实践中,治疗决策往往依赖于年龄(传统以40岁为界)、IDH突变状态、手术切除范围等孤立因素,这种简化模式难以准确捕捉疾病发展的复杂轨迹。更为棘手的是,既往研究发现的预后指标多源于治疗适宜性评估,而非真正识别需要积极干预的高危人群。随着精准医疗时代的到来,如何构建能够整合多维度信息、动态预测个体预后的工具,成为神经外科医生面临的迫切挑战。
传统统计模型如Cox比例风险模型虽然广泛应用,但在捕捉变量间复杂非线性关系方面存在固有局限。而深度学习技术的崛起为这一困境带来了转机。这类算法能够自主识别特征间的交互模式,无需预先设定假设关系。正是在这样的背景下,徐鹏飞团队开展了这项多中心验证研究,旨在开发一种能够精准预测DLGG患者生存结局的深度学习模型。
研究团队采用了严谨的多队列验证设计,数据源包括美国SEER数据库和北京大学深圳医院的临床资料。最终纳入1079例经病理确诊的DLGG患者,按8:2比例随机分为训练集(836例)、内部验证集(210例)和外部验证集(33例)。所有病例均具备完整的分子分型资料和手术治疗记录,确保了数据的可靠性。
在技术方法层面,研究选用DeepSurv这一专门用于生存分析的深度学习框架。模型纳入7个关键临床病理变量:年龄、性别、肿瘤大小、分子亚型、手术范围、放疗和化疗情况。通过系统的超参数优化,最终确定最优网络结构为单隐藏层(16个神经元),采用ReLU激活函数,学习率设为0.0001,训练1000轮次。为评估模型性能,研究采用C-index衡量判别能力,使用Brier评分和集成Brier评分(IBS)评估校准度。特征重要性通过置换重要性和SHAP值双重验证。
三组队列的基线特征比较显示,除手术切除范围存在差异(P<0.001)外,其他临床参数均具有可比性。训练队列中位年龄40.5岁,男性占59.2%,肿瘤平均大小46.1±36.9 mm。分子分型分布为:IDH突变型星形细胞瘤38.8%,IDH野生型星形细胞瘤11.7%,IDH突变型少突胶质细胞瘤49.5%。治疗方面,根治性切除(GTR)占43.3%,41.9%患者未接受辅助治疗,49.2%接受同步放化疗(CRT)。
深度学习模型在所有队列中均表现出优异的预测性能。训练集、内部验证集和外部验证集的C-index分别为0.81、0.76和0.87,显示出色的判别能力。IBS值分别为0.04、0.04和0.03,证实模型具有良好的校准度。
时间依赖性Brier评分分析显示,在40个月随访期内,所有队列的评分均保持在0.25参考值以下,表明模型在不同时间点均保持稳定预测准确性。
置换重要性分析和SHAP值共同证实年龄是最强预后因素,其次为IDH突变状态。年龄呈现非线性效应,50岁后预后价值显著增强,尤其在IDH野生型肿瘤中更为明显。
交互分析显示分子亚型与年龄存在协同效应。IDH野生型肿瘤中,老年患者(>60岁)的SHAP值显著升高,预示更差生存结局。
为实现临床转化,团队开发了基于Streamlit框架的交互式网络平台,可输入患者参数后生成个性化生存曲线,直观展示1年、3年和5年生存概率。
该研究的创新价值在于成功将深度学习技术应用于DLGG预后预测,突破了传统模型的线性假设限制。模型不仅验证了年龄和IDH状态的核心预后价值,还揭示了这些因素间的复杂交互关系。特别是发现50岁作为预后转折点,以及IDH野生型肿瘤中年龄效应的放大现象,为高危患者识别提供了新视角。
然而研究也存在若干局限。外部验证队列样本量较小,且缺乏活检病例可能影响泛化能力。更重要的是,根据2021年WHO分类标准,部分IDH野生型病例可能实际为分子特征定义的胶质母细胞瘤,而SEER数据库缺乏必要的分子标记(如EGFR扩增、7号染色体增益/10号染色体缺失等)进行准确重分类。未来研究整合更全面的分子谱(如CDKN2A/B纯合缺失、TERT启动子突变等)将进一步提升模型精度。
这项发表于《Discover Oncology》的工作标志着DLGG预后评估向精准化迈出重要一步。通过将复杂临床数据转化为直观预测工具,该模型有望辅助医生制定更个体化的治疗策略,最终改善患者生存质量。随着多组学数据的不断积累和算法持续优化,深度学习必将在神经肿瘤预后预测领域发挥更大价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号