
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多参数机器学习的肺结节高风险预后病理成分预测模型:整合临床特征、血清肿瘤标志物与影像学特征
【字体: 大 中 小 】 时间:2025年06月18日 来源:Journal of Cancer Research and Clinical Oncology 2.7
编辑推荐:
这篇研究通过整合临床特征、血清肿瘤标志物(如CEA、CYFRA21-1)及CT影像学参数,构建了XGBoost(XGB)机器学习模型,用于预测肺结节(PNs)中的高风险预后病理成分(HRPPC)。模型在训练组和验证组的AUC分别达0.930和0.835,SHAP分析显示CT值、结节长径和PRO-GRP为关键预测因子,为非侵入性术前风险评估提供了可靠工具。
肺结节(PNs)是直径≤30 mm的局灶性肺部阴影,随着CT筛查普及,其检出率显著上升,但区分高风险预后病理成分(HRPPC,如微乳头状/实性成分MP/S)仍是临床挑战。HRPPC与不良预后相关,但现有影像学(如CT)和血清标志物(CEA、CYFRA21-1等)单独应用时敏感性和特异性不足。本研究旨在通过整合多模态数据构建机器学习模型,提升HRPPC的术前预测准确性。
回顾性纳入山东大学齐鲁医院816例≤3 cm肺结节手术患者,排除标准包括多发性结节或术前病理确诊恶性。通过Lasso回归筛选13个关键特征,包括CT值、结节长径、PRO-GRP等。采用7种机器学习算法(如XGB、SVM)建模,以ROC曲线、校准曲线和决策曲线分析(DCA)评估性能。
XGB模型表现最优,训练组AUC 0.930(95% CI: 0.906–0.954),验证组0.835(95% CI: 0.774–0.895)。SHAP分析揭示CT值(反映肿瘤密度)、结节长径(>2 cm风险更高)和PRO-GRP(间接提示侵袭性)为前三位预测因子。模型校准良好,DCA显示其临床净收益显著高于传统策略。
相比单一数据源模型(如Brock评分或单纯影像组学),本研究整合临床-影像-血清标志物,突破线性回归局限,更精准捕捉HRPPC的非线性特征。例如,高CT值可能与肿瘤细胞密集度相关,而PRO-GRP在腺癌中异常提示EMT进程。模型可辅助制定个体化手术方案(如亚肺叶切除或淋巴结清扫),或指导非手术患者选择立体定向放疗(SBRT)。
单中心回顾性设计可能引入选择偏倚,且部分潜在标志物(如LDH)未纳入。未来需多中心前瞻性验证,并探索动态监测模型的预后价值。
XGB模型为肺结节HRPPC提供了高精度、可解释的非侵入性预测工具,有望优化临床决策流程,减少过度诊疗。
生物通微信公众号
知名企业招聘