表型年龄加速:良性前列腺增生风险预测的新指标及其机器学习模型构建

【字体: 时间:2025年09月27日 来源:GeroScience 5.4

编辑推荐:

  本研究针对良性前列腺增生(BPH)早期预测需求,通过分析NHANES队列784名男性数据,首次证实表型年龄加速(PhenoAgeAccel)是BPH的独立风险因子(OR=1.08, p<0.001)。团队利用递归特征消除(RFE)筛选34个关键特征构建XGBoost预测模型(AUC=0.853),并通过SHAP分析揭示表型年龄在风险分层中的临床价值,为BPH的精准预防提供了新型生物标志物和人工智能辅助决策方案。

  
随着全球老龄化进程加速,良性前列腺增生(Benign Prostatic Hyperplasia, BPH)已成为困扰中老年男性的常见泌尿系统疾病,全球患者数高达9400万。传统观点认为BPH是单纯年龄相关性疾病,但近年来发病呈现年轻化趋势,仅用chronological age( chronological age, chronological age)已无法完全解释疾病的发生机制。这种"衰老悖论"促使科学家将目光投向更能反映机体功能状态的生物衰老标志物——表型年龄(phenotypic age)。
表型年龄通过整合chronological age与9项血清生物标志物(白蛋白、碱性磷酸酶、肌酐、葡萄糖、C反应蛋白、淋巴细胞百分比、平均红细胞体积、红细胞分布宽度、白细胞计数)计算得出。当表型年龄大于chronological age时称为表型年龄加速(PhenoAgeAccel),反之则为减速(PhenoAgeDecel)。这种综合指标能更精准地反映个体生物学衰老程度,已在心血管疾病、呼吸系统疾病等领域展现出卓越的预测价值。然而,其在BPH风险评估中的作用尚未明确。
为此,由中国医学科学院肿瘤医院叶雄俊教授团队联合北京交通大学、北京克娄DNA科技有限公司等机构开展了一项创新性研究,成果发表于《GeroScience》。研究团队利用美国国家健康与营养调查(NHANES)2003-2008年784名男性的临床数据,首次系统探讨了表型年龄加速与BPH风险的关联,并成功构建了机器学习预测模型。
研究采用的关键技术方法包括:基于Levine算法的表型年龄计算、递归特征消除(RFE)联合支持向量机(SVM)的特征筛选、XGBoost机器学习建模、五折交叉验证、SHAP(SHapley Additive exPlanations)模型可解释性分析,以及逻辑回归评估表型年龄加速与BPH的关联性。所有数据均来自NHANES公开队列,包含详细的问卷调查和实验室检测指标。
研究结果
参与者特征分析
研究纳入784名男性参与者,其中621人确诊BPH。表型年龄加速组(PhenoAgeAccel)的平均chronological age为69±9.8岁,而表型年龄减速组(PhenoAgeDecel)为66±10岁。两组表型年龄差异达13年,BPH患病率分别为78%和84%。
BPH相关特征筛选
通过递归特征消除(RFE)联合支持向量机(SVM)筛选出34个BPH相关特征。如图1所示,当包含41个特征时模型达到最佳性能(AUC峰值)。最终确定的前5位重要特征依次为:单核细胞计数(LBDMONO)、癌症病史(MCQ220)、渗透压(LBXSOSSI)、总胆固醇(LBDTCSI)和白细胞计数(LBXWBCSI)。
预测模型构建与验证
研究比较了随机森林(RF)、逻辑回归(LR)和XGBoost三种算法,XGBoost表现最优(测试集AUC=0.833,ACC=0.783)。如图2所示,模型在验证集灵敏度为0.819,特异性为0.677。五折交叉验证平均AUC为0.819(范围0.798-0.859)。在外部验证集(NHANES 2001-2002,n=228)中,模型保持较高灵敏度(0.772),AUC为0.707。
表型年龄加速与BPH的关联
如图3A所示,表型年龄与红细胞分布宽度(RDW)(r=0.45)和肌酐(r=0.47)呈最强正相关,与淋巴细胞百分比(r=-0.26)和白蛋白(r=-0.24)呈负相关。表型年龄与chronological age高度相关(r=0.833,图3B)。分层分析发现,在40-70岁人群中,BPH患者的表型年龄加速显著高于非BPH组,但在70岁以上人群中差异不显著(图3D)。逻辑回归显示,表型年龄加速每增加一个标准差,BPH风险增加8%(OR=1.08,95%CI:1.065-1.114,p<0.001,图3E)。
表型年龄的预测效能
用表型年龄替代chronological age后,XGBoost模型性能进一步提升(测试集AUC=0.853)。SHAP分析(图4C-D)显示,表型年龄是第三重要的预测因子(SHAP值=0.040),仅次于癌症病史(0.307)和铅暴露(LBXBPB,0.054)。
研究结论与意义
本研究首次证实表型年龄加速是BPH的独立风险因素,揭示了生物衰老加速与前列腺疾病发生的内在联系。研究发现40-70岁人群的表型年龄加速与BPH风险呈显著正相关,但在70岁以上人群中因"衰老天花板效应"而减弱,这为BPH年轻化趋势提供了合理解释——年轻人若因环境压力、慢性炎症等因素导致生物衰老加速,其前列腺可能提前进入衰老状态。
通过机器学习构建的预测模型实现了0.853的AUC值,显著优于传统基于chronological age的模型。特征重要性分析揭示了系统性炎症(单核细胞计数、白细胞计数)、营养状态(白蛋白)和代谢指标(胆固醇)在BPH发生中的关键作用,支持了BPH是全身性衰老过程局部体现的理论框架。
研究的创新点在于:将衰老研究前沿指标表型年龄引入BPH风险评估;采用机器学习处理高维临床数据;通过SHAP增强模型可解释性;发现表型年龄加速在中年人群中的预警价值。这些成果为BPH的精准预防提供了新思路——临床关注点应从chronological age转向phenotypic age,对年轻患者出现排尿障碍时,应评估其生物衰老状态而非简单归因于心理因素。
未来研究需在多中心队列中验证模型效能,并进一步探索多组学数据与表型年龄的整合应用。从临床实践角度,监测血清生物标志物(如RDW、肌酐、白蛋白)可能有助于早期识别高风险个体,通过抗炎和营养干预延缓BPH进展。
这项研究不仅推动了BPH风险评估模式的范式转变,也为其他年龄相关疾病的防治提供了可借鉴的研究框架——通过生物衰老标志物结合人工智能技术,实现真正意义上的精准预防和个性化健康管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号