基于机器学习的骨质疏松症风险预测模型的开发及其在临床决策支持中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Medicine》：Development of a machine learning-based predictive model for osteoporosis risk and its application in clinical decision support

【字体：大中小】 时间：2025年11月14日 来源：Frontiers in Medicine 3.0

编辑推荐：

　　骨质疏松风险预测模型的开发与可解释性工具构建。基于江西中医药大学附属医院2015-2024年5328例临床数据，通过LASSO回归筛选出年龄、性别、BMI、尿酸和碱性磷酸酶5个核心预测变量，构建并比较决策树、随机森林、XGBoost、CatBoost和MLP模型。随机森林模型在测试集AUC达0.759，SHAP分析显示BMI贡献度最高，年龄、性别、ALP升高和UA降低显著增加风险。最终开发Web可视化工具，实现风险预测与SHAP归因的可视化，为临床决策提供支持。

　　骨质疏松症（Osteoporosis, OP）是一种影响骨骼系统的疾病，其主要特征是骨矿物质密度（Bone Mineral Density, BMD）下降和骨微结构破坏，导致骨骼强度减弱，进而增加骨折风险。随着全球人口老龄化的加剧，OP已成为威胁老年人生活质量与生存率的重要健康问题。根据国际骨质疏松基金会（IOF）的统计，全球约三分之一的女性和五分之一的男性在50岁之后可能经历至少一次骨质疏松性骨折，这使得OP成为全球范围内的重大公共卫生挑战。因此，开发一种能够早期识别高风险人群、并支持及时干预的预测模型显得尤为迫切。

在临床实践中，OP的诊断通常依赖于双能X射线吸收法（Dual-energy X-ray Absorptiometry, DXA）来评估BMD，其中T值≤-2.5被用作诊断标准。然而，DXA设备在基层医疗环境中普及度较低，主要受限于其高昂的成本和技术要求。此外，DXA仅能提供静态的骨密度数据，无法反映骨代谢的动态变化，这在大规模筛查中显得不够高效。传统工具如FRAX模型虽然在临床中广泛应用，但其预测能力受到临床风险因素数量的限制，例如仅包括年龄、性别、体重和骨折史等有限变量，难以全面捕捉骨代谢的多维调控机制。近年来，研究发现OP的发生机制复杂，涉及年龄、性别、内分泌功能、炎症状态、营养因素以及与骨代谢相关的多种生化指标之间的交互作用。例如，血清中的碱性磷酸酶（Alkaline Phosphatase, ALP）、尿酸（Uric Acid, UA）、淋巴细胞比率、血清淀粉样蛋白A（Serum Amyloid A, SAA）和系统免疫炎症指数（Systemic Immune-Inflammation Index, SII）等指标已被证实与OP风险密切相关，为构建高维、多参数的预测模型提供了理论依据。

尽管已有不少关于OP预测的研究，但大多数模型仍然基于公开数据集构建，缺乏在真实临床环境中的验证，这限制了其推广和应用。此外，许多研究依赖于单变量统计测试或专家驱动的方法进行特征选择，缺乏系统性的变量筛选策略。同时，缺乏直观的可视化工具也阻碍了这些模型在临床中的实际应用。因此，本研究旨在通过真实临床数据，构建一个可解释的机器学习模型，用于预测OP风险，并开发一个基于网络的可视化工具，以辅助临床决策。

本研究的数据来源于江西省中医药大学附属医院2015年至2024年的临床记录，共收集了5,328名参与者。数据涵盖了人口学特征、体格测量指标、腰椎骨矿物质密度（L1–L4）以及超过90项血液生化和炎症相关指标。研究首先通过单变量分析筛选出具有统计显著性的变量，随后利用最小绝对收缩和选择算子（Least Absolute Shrinkage and Selection Operator, LASSO）回归进一步识别关键预测因子。最终确定的五个关键变量包括年龄、性别、体重指数（Body Mass Index, BMI）、尿酸（UA）和碱性磷酸酶（ALP）。这些变量在后续的机器学习模型构建中被采用，以提高预测的准确性和可解释性。

为了构建和评估模型，研究者选择了五种机器学习算法：决策树（Decision Tree）、随机森林（Random Forest）、XGBoost、CatBoost和多层感知机（Multi-Layer Perceptron, MLP）。数据被随机分为训练集（70%）和测试集（30%），模型在训练集上进行训练，并在测试集上进行评估。模型的性能通过曲线下面积（Area Under the Curve, AUC）、准确率、精确率、召回率、F1分数、阳性预测值（Positive Predictive Value, PPV）和阴性预测值（Negative Predictive Value, NPV）等指标进行衡量。在训练和测试集中，随机森林模型表现出最高的AUC值（0.759），显示出良好的区分能力和模型稳定性。此外，为了提高模型的可解释性，研究采用了SHapley Additive exPlanations（SHAP）分析，以揭示各个特征对模型预测结果的贡献。结果显示，BMI对模型预测的影响最大，而年龄增长、女性性别、ALP升高以及UA降低均与OP风险增加相关。

基于随机森林模型，研究团队开发了一个基于网络的可视化工具，使医生能够进行个体化的OP风险预测，并通过SHAP分析对预测结果进行可视化解释。该工具为临床医生提供了一个直观、实用的决策支持平台，有助于更准确地评估OP风险。此外，为了进一步验证模型的临床适用性，研究还采用决策曲线分析（Decision Curve Analysis, DCA）方法，将最优机器学习模型与基于年龄、性别和BMI的简单临床规则模型进行比较。结果显示，随机森林模型在净临床效益方面优于简单临床规则模型，表明其在个体化OP风险评估中的优越性。

在模型构建过程中，研究团队特别关注模型的可解释性，以确保其在临床中的应用价值。SHAP分析不仅能够提供全局层面的特征贡献，还能对单个样本进行解释，揭示特定变量如何影响预测结果。相比之下，LIME（Local Interpretable Model-agnostic Explanations）算法则用于局部解释，通过扰动输入数据并观察输出变化，来估算每个变量对预测结果的局部贡献。研究者对代表性病例进行了LIME解释图的可视化，以补充SHAP分析的结果，增强模型解释的全面性和可信度。

为了确保模型的稳定性和可靠性，研究采用了十折交叉验证（Ten-fold Cross-Validation）方法，对模型在训练、验证和测试集上的表现进行了评估。结果显示，随机森林模型在训练和测试集中均表现出良好的稳定性，且在测试集中未出现明显的过拟合现象。这表明该模型在不同数据集上的泛化能力较强，能够有效应用于真实临床环境。此外，研究还通过统计分析验证了模型的性能，结果显示随机森林模型在AUC、准确率、精确率和召回率等指标上均优于其他算法，进一步确认了其作为最优模型的地位。

本研究的数据分析过程使用了R语言（v4.2.1）和Python语言（v3.9）进行编程实现。对于符合正态分布的变量，研究者使用均值±标准差（Mean ± Standard Deviation, SD）进行描述，并通过独立样本t检验进行比较。对于不符合正态分布的变量，研究者使用中位数（Median）及其四分位间距（Interquartile Range, IQR）进行描述，并通过曼-惠特尼U检验（Mann–Whitney U test）进行比较。对于分类变量，研究者使用频率（Frequency）及其百分比（Percentage）进行描述，并通过卡方检验（Chi-square test）进行比较。所有统计分析均采用双尾检验，以确定结果的显著性。变量选择过程中，研究者通过LASSO回归筛选出具有非零系数的关键变量，这些变量在训练和测试集中均保持了一致的非零系数，表明其在模型中的重要性较高。

在模型评估方面，研究者不仅关注模型的预测能力，还特别强调了模型的可解释性。通过SHAP分析，研究团队能够直观地展示各个特征对模型输出的贡献，从而帮助医生理解模型的决策过程。例如，BMI在模型中对OP风险预测的影响最大，而年龄增长、女性性别、ALP升高以及UA降低均与OP风险增加相关。这种解释不仅有助于医生更好地理解模型的输出，还能增强患者对预测结果的信任，提高临床决策的科学性和准确性。

此外，研究团队还开发了一个基于网络的可视化工具，使医生能够实时输入个体特征值，获取OP风险预测结果，并通过SHAP分析进行可视化解释。该工具为临床医生提供了一个透明且直观的决策支持平台，有助于更高效地进行OP风险评估。通过这一工具，医生可以快速识别高风险患者，并根据模型的解释结果制定个性化的干预措施。这不仅提高了临床工作效率，还增强了医生对OP风险预测的信心。

本研究的成果表明，基于真实临床数据构建的OP预测模型能够在有限的特征集上实现定量风险评估，并提供可解释的输出结果。这种模型不仅具备良好的预测性能，还能够帮助医生更好地理解预测依据，从而提高临床决策的准确性。然而，由于本研究仅基于单一中心的数据进行分析，缺乏外部独立队列的验证，这可能会影响模型在其他地区和不同人群中的适用性。因此，未来的研究应进一步关注模型的外部验证和重新校准，以评估其在多中心人群中的预测性能和临床适用性。

总体而言，本研究通过整合临床数据与机器学习技术，构建了一个具有实际应用价值的OP风险预测模型。该模型不仅在预测能力上表现出色，还通过SHAP分析提供了清晰的解释，增强了其在临床中的可信度。此外，开发的基于网络的可视化工具为医生提供了一个直观、实用的决策支持平台，有助于更高效地进行OP风险评估。这些成果为OP的早期筛查和干预提供了新的技术路径，具有重要的临床和科研意义。未来的研究应进一步扩大数据来源，进行多中心验证，以确保模型的广泛适用性和稳定性，同时探索更多可解释的模型构建方法，以提高OP风险预测的准确性和临床价值。

联系信箱：

粤ICP备09063491号

热点排行