
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于特征选择技术与机器学习模型在骨质疏松症患病率预测中的比较分析
【字体: 大 中 小 】 时间:2025年05月30日 来源:Journal of Medical Systems 3.5
编辑推荐:
推荐 为优化骨质疏松症患病率预测模型,研究人员开展了基于Boruta、XGBoost和Lasso三种特征选择技术对RF、XGBoost、LR和SVM四种模型的性能评估。结果表明,Boruta-XGBoost组合(准确率0.9083±0.0146)显著优于Lasso-LR组合(0.7480±0.0157),且RF模型通过AUROC值展现了更强的非线性特征捕捉能力,为精准医疗提供了新思路。
翻译
本研究系统评估了三种特征选择技术(Boruta、极端梯度提升[XGBoost]和Lasso)对四种机器学习模型(随机森林[RF]、XGBoost、逻辑回归[LR]和支持向量机[SVM])在预测骨密度患病率中的优化效果。结果显示,不同数据划分比例(训练集与测试集比例为0.6:0.4、0.7:0.3、0.8:0.2、0.9:0.1)对所有模型的预测准确率影响极小,该结论通过10倍交叉验证得到进一步验证。此外,主成分分析(PCA)导致准确率显著下降(范围为0.6–0.8),表明其因原始高维数据的复杂决策边界而不适用于本研究需求。比较分析表明,Boruta-XGBoost组合的性能最优(准确率为0.9083±0.0146),显著优于Lasso-LR组合(0.7480±0.0157)。在模型评估指标方面,RF模型展现出更强的判别能力,其受试者工作特征曲线下面积(AUROC)值在不同特征选择方法下分别为0.85、0.81和0.80,均高于SVM模型(0.78、0.76和0.76)。这一优势可能源于RF模型固有捕捉非线性关系和特征交互作用的能力。
生物通微信公众号
知名企业招聘