基于机器学习的肺高级别神经内分泌癌同步骨转移风险预测模型构建及流行病学分析

【字体: 时间:2025年07月10日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对肺高级别神经内分泌癌(NETs)患者同步骨转移(BM)早期预测难题,通过SEER数据库大样本分析,采用八种机器学习算法构建预测模型。研究发现肝转移是BM最强预测因子,GBM模型预测效能最优(AUC 0.723),患者中位生存期仅8个月。该研究为临床早期干预提供了重要决策工具。

  

肺高级别神经内分泌癌作为肺癌中侵袭性最强的亚型,包括小细胞肺癌(SCLC)和大细胞神经内分泌癌(LCNEC),其骨转移发生率高达23%,患者中位生存期不足1年。然而,传统诊断方法难以早期发现骨转移,且缺乏有效的风险预测工具。更令人担忧的是,骨转移引发的病理性骨折、脊髓压迫等骨骼相关事件(SREs),会使患者生活质量急剧恶化。面对这一临床困境,义乌市中心医院手足外科的研究团队开展了一项突破性研究。

研究人员利用美国SEER数据库2010-2021年间21,809例患者数据,创新性地应用八种机器学习算法构建预测模型。研究首先发现SCLC患者骨转移年发病率显著下降(APC -2.3%),而LCNEC保持稳定。通过十折交叉验证,随机梯度提升(GBM)模型从八种算法中脱颖而出,在验证队列中AUC达0.723。SHAP分析揭示肝转移是最强预测因子(OR 3.87),与年龄存在显著协同效应——年轻肝转移患者风险最高。生存分析显示,单纯骨转移患者中位癌症特异性生存(CSS)仅8个月,且LCNEC与SCLC无显著差异。该成果发表于《Scientific Reports》,为临床早期识别高风险患者提供了智能决策工具。

关键技术方法包括:1) SEER数据库提取21,809例高分级肺NETs患者数据;2) 年龄标准化发病率(ASIR)和年度百分比变化(APC)计算;3) 八种机器学习算法(XGB、DT、GBM等)建模;4) SHAP可解释性分析;5) Kaplan-Meier生存分析。

发病率分析结果
2010-2021年间,SCLC伴同步BM发病率显著下降(1.52→1.16/10万人年),男性下降更显著(APC -3.1% vs -1.5%)。LCNEC发病率保持稳定(0.05→0.06/10万人年)。

预测模型构建
GBM模型表现最优,训练集和验证集AUC分别为0.733和0.723。校准曲线显示预测值与实测值高度一致。决策曲线分析证实其临床适用性。

关键预测因子
SHAP分析显示变量重要性排序为:肝转移>N分期>年龄>肺转移>性别>脑转移>T分期>婚姻状况。其中肝转移患者BM风险增加3.87倍,且与年龄呈非线性交互作用。

生存分析结果
转移模式显著影响预后:无转移患者生存最优,单纯BM患者中位CSS为8个月,合并其他转移者生存最差。值得注意的是,LCNEC与SCLC在单纯BM患者中生存无差异(P>0.05)。

这项研究首次建立了肺高级别NETs骨转移的机器学习预测模型,其创新价值体现在三方面:首先,GBM模型突破传统统计方法局限,实现个体化风险量化;其次,发现肝转移的核心预测作用,提示可能存在"肝-骨转移轴"的生物学机制;最后,证实免疫治疗时代下,骨转移患者预后仍极差,凸显早期干预的紧迫性。研究存在的局限性包括缺乏外部验证和分子标志物数据,这为未来研究指明了方向。该成果不仅为临床实践提供决策支持,更为探索神经内分泌肿瘤转移机制提供了新思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号