
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于SEER数据库的原发性骨淋巴瘤流行病学特征及机器学习预后模型构建研究
【字体: 大 中 小 】 时间:2025年05月25日 来源:Annals of Hematology 3
编辑推荐:
本研究针对原发性骨淋巴瘤(PLB)流行病学特征争议和预后评估难题,通过SEER数据库回顾性分析1222例患者数据,揭示1975-2019年发病率变化趋势(AAPC 0.21),发现年龄、分期、化疗等8项独立预后因素,并创新性构建99种机器学习模型,最终确立随机生存森林(RSF)模型(C-index 0.76)为最优预测工具,为临床个体化诊疗提供量化依据。
原发性骨淋巴瘤(PLB)作为罕见的结外淋巴瘤,其发病率不足成人淋巴瘤的2%,却占所有原发性骨恶性肿瘤的7%。这种好发于30-60岁男性的疾病,常累及股骨(29%)、骨盆(19%)等部位,但关于其流行病学趋势和预后因素长期存在争议。传统统计方法难以处理PLB复杂的多因素交互作用,而SEER数据库这类涵盖美国30%人口的癌症登记系统,为破解这一难题提供了数据基础。
北京同仁医院血液科王亮团队联合南方医科大学口腔医院等机构,通过分析SEER数据库中1975-2019年的流行病学数据和1983-2015年确诊的1222例PLB患者资料,结合机器学习算法,在《Annals of Hematology》发表了这项突破性研究。研究采用Joinpoint回归分析发病率趋势,Kaplan-Meier法和Cox回归评估预后因素,并创新性整合10种机器学习算法构建99种预测模型。
流行病学分析揭示:PLB发病率在1975-1992年显著上升(APC 1.72),1992年达峰后总体下降。男性年变化率(AAPC 0.31)显著高于女性(0.04),白人(0.25)高于黑人(0.09)。年龄分层显示60-80岁患者占比最高(43.8%),80岁以上预后最差(HR=58.64)。
生存分析显示:年龄、Ann Arbor分期(III-IV期HR=1.75)、化疗(HR=0.36)和原发部位(躯干骨HR=1.99)是独立预后因素。值得注意的是,放疗虽改善总生存(OS),但对疾病特异性生存(DSS)无显著影响,提示其疗效存在争议。
机器学习模型构建中,随机生存森林(RSF)模型以最高C-index值(0.76)脱颖而出,其风险分层将患者分为低危组(5年OS 82.3%)和高危组(42.1%)。模型校准曲线和决策曲线分析证实其临床实用性,并已开发为在线预测工具。
该研究首次系统描绘了PLB四十年的流行病学图谱,破解了发病率"先升后降"的演变规律。建立的RSF模型突破传统预后评估局限,实现多因素动态权重整合。特别是发现化疗的核心地位和放疗的有限价值,为治疗规范修订提供循证依据。未来需补充分子标志物等数据以优化模型,但当前成果已为这种罕见病的精准医疗奠定基础,标志着淋巴瘤预后研究进入智能算法新时代。
生物通微信公众号
知名企业招聘