
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SOD-FE:一种基于监督异常检测和特征工程的方法,用于预测学生辍学情况
《Scientific Reports》:SOD-FE: a supervised outlier detection and feature engineering approach for student dropout prediction
【字体: 大 中 小 】 时间:2026年06月10日 来源:Scientific Reports 3.9
编辑推荐:
摘要高等教育中的学生辍学现象给教育机构和学生本身带来了学术和社会经济方面的挑战。有效的早期预测模型对于识别高风险学生并及时实施干预措施至关重要。本文提出了一种名为SOD-FE的监督式机器学习方法,该方法结合了基于标签的异常值检测与特征工程来提升辍学预测的准确性。该方法首先利用四分
高等教育中的学生辍学现象给教育机构和学生本身带来了学术和社会经济方面的挑战。有效的早期预测模型对于识别高风险学生并及时实施干预措施至关重要。本文提出了一种名为SOD-FE的监督式机器学习方法,该方法结合了基于标签的异常值检测与特征工程来提升辍学预测的准确性。该方法首先利用四分位距(IQR)进行异常值检测,并结合互信息和皮尔逊相关性来识别和减轻异常值对最终模型构建的影响。随后,通过特征选择策略对数据集进行优化。通过在两个真实世界数据集(葡萄牙和斯洛伐克)上使用五种分类算法(包括随机森林RF和极端梯度提升XGB)进行实验,评估了该方法的性能。结果表明,在5折交叉验证下,使用RF分类器时,该方法的F1分数分别达到了98.09%和98.33%。此外,SOD-FE方法在两个数据集上的F1分数比基线RF模型分别提高了7.46%和3.37%,显示出极具竞争力的结果,其性能与近期文献中报道的最高水平相当或甚至超过了最高水平(最高提高了7.33%)。该方法还采用了可解释性人工智能技术(SHAP)来增强模型的透明度,并为数据驱动的教育政策提供支持。这些发现表明,SOD-FE方法在提高教育机构的学生保留率和早期干预系统方面具有显著潜力。
生物通微信公众号