基于GBD数据与电子病历的中国甲状腺癌智能预测研究:疾病负担分析与多模型机器学习

【字体: 时间:2025年08月21日 来源:Frontiers in Endocrinology 4.6

编辑推荐:

  这篇研究结合全球疾病负担(GBD)数据与医院电子病历(EMR),通过自回归积分滑动平均(ARIMA)模型和XGBoost等机器学习算法,揭示了中国甲状腺癌1990-2021年发病率显著上升(女性增幅达24.24/10万)且峰值年龄后移,证实高体重指数(BMI)是死亡风险关键可调控因素(女性归因死亡占比上升53.06%),并构建了AUC达0.999的良恶性预测模型。

  

1 引言

甲状腺癌作为全球头颈部高发恶性肿瘤,其发病率在过去四十年呈现显著上升趋势。中国地区流行病学特征呈现独特变化:女性患者占比突出,且发病峰值年龄从1990年的55-59岁后移至2021年的60-64岁。研究创新性地整合宏观GBD数据与微观医院电子病历,通过多维度分析揭示疾病演变规律,为精准防控提供新思路。

2 材料与方法

数据来源涵盖GBD 2021数据库(ICD-10编码C73-C73.9等)及医院6,565例甲状腺病例(含4,631例恶性)。研究方法包含三大核心技术:

  • ARIMA模型:采用R语言auto.arima()函数构建,发病率预测选用ARIMA(1,1,1)模型(AIC=-140),死亡率采用ARIMA(0,1,1)(AIC=-19.88)

  • 孟德尔随机化(MR):以BMI为暴露变量,通过IVW法(OR=0.953, P=0.00242)和加权模式法(OR=0.403, P=0.0404)验证其因果效应

  • 机器学习模型:对比XGBoost、随机森林等6种算法,采用网格搜索优化参数,通过SHAP值解析特征重要性

3 结果

3.1 流行病学趋势

中国甲状腺癌年龄标准化患病率(ASPR)从199年8.1/10万升至2021年20.01/10万,女性增幅达17.62-36.4/10万。值得注意的是,男性死亡率上升31.6%(AMPR 0.38→0.49),而女性下降43.9%(0.57→0.32)。

3.2 BMI的关键作用

高BMI导致的死亡占比显著增加:男性从6.89%升至10.40%,女性从7.84%升至12%。MR分析证实BMI与甲状腺癌存在正因果关系(P<0.05)。

3.3 预测模型性能

XGBoost模型表现最优:

  • 预测精度:AUC 0.999,灵敏度0.973,特异度0.988

  • 特征重要性:BMI权重最高,其次为甲状腺球蛋白(TG)和促甲状腺激素(TSH)

  • 十年预测:2031年患病率将达23.58%,死亡率稳定在0.41%

4 讨论

研究首次实现GBD数据与临床电子病历的多尺度融合,发现三个核心规律:

  1. 1.

    女性高发病率可能与激素水平和筛查频次相关

  2. 2.

    BMI通过胰岛素抵抗等机制促进癌变,MR分析为其因果关联提供II类证据

  3. 3.

    XGBoost模型SHAP图显示BMI特征值>25时显著增加恶性风险

5 结论

该研究构建的智能预测体系为临床提供三重价值:

  • 公共卫生层面:建议将BMI监测纳入甲状腺癌筛查指南

  • 临床决策层面:模型辅助诊断准确率较传统方法提升48.7%

  • 机制研究层面:为肥胖相关甲状腺癌的分子通路研究提供新方向

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号